1. مقدمه: بازاندیشی کتاب صوتی
پدیده کتاب صوتی، اگرچه جدید نیست، در دهه گذشته دچار دگرگونیهای بنیادینی در تولید، توزیع و دریافت شده است. این مقاله از پدرسن و هاوه، برای بازمفهومسازی اساسی تجربه کتاب صوتی استدلال میکند و از نگاه صرف به آن به عنوان یک جبران رسانهای کتاب چاپی فراتر میرود. در عوض، آنها پیشنهاد میکنند که آن را به عنوان یک عمل ادبی متمایز—«خواندن با گوش»—قاببندی کنیم که باید در تداوم با شیوههای گستردهتر گوش دادن سیار که توسط فناوری دیجیتال ممکن شدهاند، درک شود.
2. تکامل تاریخی کتابهای صوتی
تاریخ کتابهای صوتی، گذار از ابزارهای جبرانی برای گروههای خاص به مصرف رسانهای جریان اصلی را آشکار میکند.
2.1 تحولات اولیه (1877-1970)
گرامافون توماس ادیسون (1877) در ابتدا برای ضبط سخنرانی در نظر گرفته شده بود. ضبطهای اولیه گفتاری نادر بودند. تا دهه 1930، ضبطهای به طول رمان در بریتانیا و ایالات متحده عمدتاً به عنوان خدمتی برای افراد نابینا، از جمله سربازان جنگ جهانی اول، پدیدار شدند. دوران پس از جنگ جهانی دوم شاهد فناوری نوارهای ریلی بود، با تنظیمات دستوپاگیر (مثلاً 20 نوار برای یک کتاب). اصطلاح «کتاب صوتی» با نوار کاست صوتی در دهه 1970 وارد کاربرد رایج شد.
2.2 دگرگونی دیجیتال (1980 تاکنون)
دهه 1980، لوح فشرده (CD) را معرفی کرد. یک تغییر محوری در سال 2002 با در دسترس بودن کتابهای صوتی قابل دانلود در قالب MP3 رخ داد. این جهش دیجیتال، که با ذخیره جنگ و صلح تولستوی روی یک آیپاد در مقابل 119 صفحه گرامافون نمونهوار شده است، دسترسی و قابلیت حمل را به شدت بهبود بخشید و محبوبیت این رسانه را تقویت کرد.
آمار کلیدی
- ویژگیهای جمعیتی کاربران (APA، 2006): کاربران کتاب صوتی جوانتر، مرفهتر و شامل سهم بیشتری از مردان (50 درصد خریداران) در مقایسه با خریداران کتاب چاپی هستند.
- رشد بازار (دانمارک): فروش از سال 2009 تا 2010 بیش از 100 درصد افزایش یافت. از سال 2009، سالانه 50,000 تا 60,000 کتاب صوتی جدید به کتابخانههای دانمارکی اضافه میشود.
- محبوبیت: گوش دادن به کتاب صوتی از معدود شیوههای خواندن است که با کاهش کلی شمار خوانندگان، در حال افزایش محبوبیت است.
3. چارچوب نظری
استدلال محوری بیان میکند که گوش دادن به یک کتاب صوتی، تجربهای اساساً متفاوت از خواندن یک متن چاپی را تشکیل میدهد که نیازمند چارچوب مفهومی خاص خود است.
3.1 خواندن با چشم در مقابل خواندن با گوش
نویسندگان بین دو حالت حسی درگیر شدن با ادبیات تمایز قائل میشوند. «خواندن با چشم» شامل رمزگشایی بصری، پیمایش با سرعت خود و درگیری فضایی با متن است. «خواندن با گوش» یک تجربه زمانی و خطی است که توسط سرعت، لحن و اجرای راوی اداره میشود. این تغییر از کنترل فضایی به کنترل زمانی، درگیری شناختی و پدیدارشناختی با روایت را تغییر میدهد.
3.2 فراتر از جبران رسانهای
مقاله گرایش به بحث درباره کتابهای صوتی صرفاً به عنوان یک جبران رسانهای (بازنمایی یک رسانه در رسانه دیگر) از چاپ را نقد میکند. این دیدگاه، قابلیتهای منحصر به فرد رسانه شنیداری، مانند اجرای صوتی، ادغام صدای محیطی و ایجاد یک فضای صوتی صمیمی و غوطهورکننده را کمارزش میکند.
3.3 شیوههای گوش دادن سیار
چارچوب، مصرف کتاب صوتی را به بومشناسی گوش دادن سیار (مانند موسیقی، پادکست) پیوند میزند. گوش دادن اغلب در حین فعالیتهای ثانویه (حملونقل، ورزش) رخ میدهد و آن را به یک عمل چندوظیفهای و مجسم شده که در زندگی روزمره جای گرفته است، تبدیل میکند، برخلاف فعالیت معمولاً اختصاصی خواندن متن چاپی.
4. روندهای بازار و استفاده
قالب دیجیتال، مخاطب کتاب صوتی را دموکراتیک و گسترش داده است. این رسانه دیگر عمدتاً با کودکان، نارساخوانی یا اختلال بینایی مرتبط نیست. راحتی پخش جریانی و دانلود از طریق تلفنهای هوشمند، پایگاه کاربری گستردهتر، جوانتر و متنوعتری را جذب کرده و مصرف ادبی را در سبکهای زندگی سیار و در حال حرکت ادغام کرده است.
5. چارچوب تحلیلی: بینش محوری و نقد
بینش محوری: سهم بنیادین پدرسن و هاوه، جداسازی قاطعانه کتاب صوتی از وضعیت «عموزاده فقیر» آن نسبت به چاپ است. آنها به درستی شناسایی میکنند که انفجار این رسانه فقط فناورانه نیست، بلکه تجربی است. این یک کتابی نیست که میشنوید؛ بلکه یک شکل روایی جدید است که از پیوند ادبیات و فرهنگ صوتی سیار متولد شده است.
جریان منطقی: استدلال آنها به شیوهای ظریف بنا میشود: 1) تاریخمندسازی برای نشان دادن تکامل رسانه از کمک پزشکی به رسانه جمعی. 2) ساختارشکنی مغالطه «جبران رسانهای». 3) طرح پارادایم «خواندن با گوش». 4) بافتارمندسازی آن درون گوش دادن سیار. این جریان قانعکننده است اما سوگیری خود را آشکار میکند.
نقاط قوت و ضعف: نقطه قوت آن، تمرکز بهموقع و خاص رسانهای است که فراتر از تحلیل ادبی به مطالعات صدا حرکت میکند. با این حال، چارچوب به طور آشکاری در مورد علم شناختی گوش دادن در مقابل خواندن ضعیف است. آنها به پدیدارشناسی اشاره میکنند اما تحقیقات قوی در مورد درک روایت، حفظ حافظه و تصویرسازی ذهنی در بین حالتهای مختلف (مانند کار دیوید سی. روبین یا انجمن بینالمللی مطالعه تجربی ادبیات) را نادیده میگیرند. این یک حذف حیاتی است. آیا درک واقعاً مشابه است؟ آیا صدای راوی مانع ساخت تخیل میشود یا آن را تقویت میکند؟ مقاله این سوالات را مطرح میکند اما هیچ تکیهگاه تجربی ارائه نمیدهد و بر تمایز نظری به جای تفاوت قابل اندازهگیری تکیه میکند.
بینشهای عملی: برای ناشران، بینش این است که از تولید کتابهای صوتی به عنوان ترجمههای صوتی صرف دست بردارند. در طراحی صدا سرمایهگذاری کنند، قالبهای سریالی مشابه پادکست را در نظر بگیرند و به «چندوظیفهگر سیار» بازارسازی کنند. برای پژوهشگران، تکلیف روشن است: پژوهش آینده باید بینرشتهای باشد و این چارچوب نظری را با روشهای تجربی از روانشناسی و علوم اعصاب پیوند دهد. پیشرفت بعدی در تعریف تجربه نخواهد بود، بلکه در سنجش تأثیر آن خواهد بود.
6. ملاحظات فنی و روششناختی
نویسندگان از یک استراتژی روششناختی تأکید بر تفاوتها برای روشن کردن تجربیات متمایز استفاده میکنند و اذعان میکنند که شیوههای دنیای واقعی پیچیدهتر و به هم پیوستهتر هستند.
جزئیات فنی و صورتگرایی: اگرچه این یک مقاله فنی نیست، اما تجربه را میتوان مدل کرد. مصرف خطی و زمانمند یک کتاب صوتی را میتوان با دسترسی غیرخطی چاپ مقایسه کرد. اگر یک روایت را به عنوان دنبالهای از رویدادها $N = \{e_1, e_2, ..., e_n\}$ در نظر بگیریم، خواندن چاپی اجازه یک تابع دسترسی غیرترتیبی $f_{print}(t) \rightarrow e_i$ را میدهد که در آن $i$ میتواند هر اندیسی باشد. گوش دادن به کتاب صوتی یک تابع ترتیبی $f_{audio}(t) \rightarrow e_{k(t)}$ را تحمیل میکند که در آن $k(t)$ یک تابع یکنوا از زمان است، که توسط سرعت پخش دیکته میشود. این محدودیت بنیادی، تجربه را شکل میدهد.
مثال چارچوب تحلیل (غیرکد): برای تحلیل یک اقتباس کتاب صوتی، ممکن است از چارچوب زیر استفاده کرد:
- تحلیل پیرامتنی: بررسی انتخاب راوی، طرح جلد صوتی و فرادادههای پلتفرم (مانند «شامل مصاحبه اختصاصی با نویسنده»).
- تحلیل اجرا: ارزیابی ارائه صوتی (سرعت، زیروبمی، تمایز شخصیت)، استفاده از سکوت و لحن عاطفی.
- تحلیل بافتاری: در نظر گرفتن سناریوهای معمول گوش دادن (مانند ماشین، باشگاه) و چگونگی تأثیر آنها بر دریافت.
- تحلیل تطبیقی: مقایسه نقدهای شنوندگان در پلتفرمهایی مانند Audible با نقدهای خوانندگان نسخه چاپی در Goodreads، با جستجوی بازخوردهای خاص حالت.
نتایج تجربی و توصیف نمودار: اگرچه خود مقاله هیچ آزمایش جدیدی ارائه نمیدهد، اما با نتایج نظرسنجیهایی مانند دادههای APA 2006 همسو است. یک نمودار فرضی که از تز آنها حمایت میکند میتواند یک نمودار دو محوره باشد که نشان میدهد: 1) محور Y اولیه: نرخ رشد سالانه فروش کتابهای صوتی (منحنی صعودی تند پس از 2005). 2) محور Y ثانویه: درصد مصرف کتاب صوتی که در حین «فعالیتهای سیار» مانند رفتوآمد یا ورزش رخ میدهد (میلهای به طور مداوم بالا، مثلاً >70%). این نمودار به صورت بصری استدلال میکند که رشد به استفاده سیار و موقعیتی گره خورده است.
7. کاربردهای آینده و جهتگیریهای پژوهشی
صوت غوطهورکننده و تعاملی: آینده در بهرهگیری از صدای فضایی سهبعدی (صدای دوگوشی) و ساختارهای روایی تعاملی (مشابه پادکستهای «سرنوشت خود را انتخاب کن» یا داستانهای تعاملی هدایتشده توسط هوش مصنوعی) نهفته است. پلتفرمهایی مانند «Audible Originals» در حال حاضر در حال کاوش این مرز هستند.
روایت شخصیسازی شده: پیشرفتها در متنبهگفتار با وفاداری بالا (TTS) و شبیهسازی صدا با هوش مصنوعی (مشاهده پژوهش از شرکتهایی مانند Respeecher یا VALL-E مایکروسافت) میتواند راویان شخصیسازی شدهای را ممکن سازد که لحن، سرعت یا حتی گویش را بر اساس ترجیح شنونده تنظیم میکنند.
ادغام با دستگاههای چندوجهی: پژوهش باید تغییر یکپارچه بین صوت و متن روی دستگاههایی مانند عینکهای هوشمند یا کتابخوانهای جوهر الکترونیکی را بررسی کند و یک تجربه خواندن/گوش دادن ترکیبی ایجاد کند که نقاط قوت هر دو حالت را به کار گیرد.
مطالعات شناختی و تجربی: حیاتیترین جهت، پژوهش تجربی است که درک، القای همدلی و شکلگیری حافظه بلندمدت را بین مصرف صوت و چاپ مقایسه میکند و عواملی مانند پیچیدگی روایت و تخصص شنونده/خواننده را کنترل میکند.
8. منابع
- Pedersen, B. S., & Have, I. (2012). Conceptualising the audiobook experience. SoundEffects, 2(2), 80-92.
- Rubery, M. (Ed.). (2011). Audiobooks, Literature, and Sound Studies. Routledge.
- Audio Publishers Association (APA). (2006). Sales Survey.
- Nielsen, L. B. (2012). Audiobook lending in Danish libraries. Danish Library Authority.
- Rubin, D. C. (1995). Memory in Oral Traditions: The Cognitive Psychology of Epic, Ballads, and Counting-Out Rhymes. Oxford University Press.
- International Society for the Empirical Study of Literature (IGEL). (n.d.). Research Publications. Retrieved from https://www.igel.news/
- Microsoft Research. (2023). VALL-E: Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers. arXiv:2301.02111