مفهوم‌سازی تجربه کتاب صوتی: چارچوب نظری

1. مقدمه: بازاندیشی کتاب صوتی

پدیده کتاب صوتی، اگرچه جدید نیست، در دهه گذشته دچار دگرگونی‌های بنیادینی در تولید، توزیع و دریافت شده است. این مقاله از پدرسن و هاوه، برای بازمفهوم‌سازی اساسی تجربه کتاب صوتی استدلال می‌کند و از نگاه صرف به آن به عنوان یک جبران رسانه‌ای کتاب چاپی فراتر می‌رود. در عوض، آن‌ها پیشنهاد می‌کنند که آن را به عنوان یک عمل ادبی متمایز—«خواندن با گوش»—قاب‌بندی کنیم که باید در تداوم با شیوه‌های گسترده‌تر گوش دادن سیار که توسط فناوری دیجیتال ممکن شده‌اند، درک شود.

2. تکامل تاریخی کتاب‌های صوتی

تاریخ کتاب‌های صوتی، گذار از ابزارهای جبرانی برای گروه‌های خاص به مصرف رسانه‌ای جریان اصلی را آشکار می‌کند.

2.1 تحولات اولیه (1877-1970)

گرامافون توماس ادیسون (1877) در ابتدا برای ضبط سخنرانی در نظر گرفته شده بود. ضبط‌های اولیه گفتاری نادر بودند. تا دهه 1930، ضبط‌های به طول رمان در بریتانیا و ایالات متحده عمدتاً به عنوان خدمتی برای افراد نابینا، از جمله سربازان جنگ جهانی اول، پدیدار شدند. دوران پس از جنگ جهانی دوم شاهد فناوری نوارهای ریلی بود، با تنظیمات دست‌وپاگیر (مثلاً 20 نوار برای یک کتاب). اصطلاح «کتاب صوتی» با نوار کاست صوتی در دهه 1970 وارد کاربرد رایج شد.

2.2 دگرگونی دیجیتال (1980 تاکنون)

دهه 1980، لوح فشرده (CD) را معرفی کرد. یک تغییر محوری در سال 2002 با در دسترس بودن کتاب‌های صوتی قابل دانلود در قالب MP3 رخ داد. این جهش دیجیتال، که با ذخیره جنگ و صلح تولستوی روی یک آی‌پاد در مقابل 119 صفحه گرامافون نمونه‌وار شده است، دسترسی و قابلیت حمل را به شدت بهبود بخشید و محبوبیت این رسانه را تقویت کرد.

آمار کلیدی

ویژگی‌های جمعیتی کاربران (APA، 2006): کاربران کتاب صوتی جوان‌تر، مرفه‌تر و شامل سهم بیشتری از مردان (50 درصد خریداران) در مقایسه با خریداران کتاب چاپی هستند.
رشد بازار (دانمارک): فروش از سال 2009 تا 2010 بیش از 100 درصد افزایش یافت. از سال 2009، سالانه 50,000 تا 60,000 کتاب صوتی جدید به کتابخانه‌های دانمارکی اضافه می‌شود.
محبوبیت: گوش دادن به کتاب صوتی از معدود شیوه‌های خواندن است که با کاهش کلی شمار خوانندگان، در حال افزایش محبوبیت است.

3. چارچوب نظری

استدلال محوری بیان می‌کند که گوش دادن به یک کتاب صوتی، تجربه‌ای اساساً متفاوت از خواندن یک متن چاپی را تشکیل می‌دهد که نیازمند چارچوب مفهومی خاص خود است.

3.1 خواندن با چشم در مقابل خواندن با گوش

نویسندگان بین دو حالت حسی درگیر شدن با ادبیات تمایز قائل می‌شوند. «خواندن با چشم» شامل رمزگشایی بصری، پیمایش با سرعت خود و درگیری فضایی با متن است. «خواندن با گوش» یک تجربه زمانی و خطی است که توسط سرعت، لحن و اجرای راوی اداره می‌شود. این تغییر از کنترل فضایی به کنترل زمانی، درگیری شناختی و پدیدارشناختی با روایت را تغییر می‌دهد.

3.2 فراتر از جبران رسانه‌ای

مقاله گرایش به بحث درباره کتاب‌های صوتی صرفاً به عنوان یک جبران رسانه‌ای (بازنمایی یک رسانه در رسانه دیگر) از چاپ را نقد می‌کند. این دیدگاه، قابلیت‌های منحصر به فرد رسانه شنیداری، مانند اجرای صوتی، ادغام صدای محیطی و ایجاد یک فضای صوتی صمیمی و غوطه‌ورکننده را کم‌ارزش می‌کند.

3.3 شیوه‌های گوش دادن سیار

چارچوب، مصرف کتاب صوتی را به بوم‌شناسی گوش دادن سیار (مانند موسیقی، پادکست) پیوند می‌زند. گوش دادن اغلب در حین فعالیت‌های ثانویه (حمل‌ونقل، ورزش) رخ می‌دهد و آن را به یک عمل چندوظیفه‌ای و مجسم شده که در زندگی روزمره جای گرفته است، تبدیل می‌کند، برخلاف فعالیت معمولاً اختصاصی خواندن متن چاپی.

4. روندهای بازار و استفاده

قالب دیجیتال، مخاطب کتاب صوتی را دموکراتیک و گسترش داده است. این رسانه دیگر عمدتاً با کودکان، نارساخوانی یا اختلال بینایی مرتبط نیست. راحتی پخش جریانی و دانلود از طریق تلفن‌های هوشمند، پایگاه کاربری گسترده‌تر، جوان‌تر و متنوع‌تری را جذب کرده و مصرف ادبی را در سبک‌های زندگی سیار و در حال حرکت ادغام کرده است.

5. چارچوب تحلیلی: بینش محوری و نقد

بینش محوری: سهم بنیادین پدرسن و هاوه، جداسازی قاطعانه کتاب صوتی از وضعیت «عموزاده فقیر» آن نسبت به چاپ است. آن‌ها به درستی شناسایی می‌کنند که انفجار این رسانه فقط فناورانه نیست، بلکه تجربی است. این یک کتابی نیست که می‌شنوید؛ بلکه یک شکل روایی جدید است که از پیوند ادبیات و فرهنگ صوتی سیار متولد شده است.

جریان منطقی: استدلال آن‌ها به شیوه‌ای ظریف بنا می‌شود: 1) تاریخ‌مندسازی برای نشان دادن تکامل رسانه از کمک پزشکی به رسانه جمعی. 2) ساختارشکنی مغالطه «جبران رسانه‌ای». 3) طرح پارادایم «خواندن با گوش». 4) بافتارمندسازی آن درون گوش دادن سیار. این جریان قانع‌کننده است اما سوگیری خود را آشکار می‌کند.

نقاط قوت و ضعف: نقطه قوت آن، تمرکز به‌موقع و خاص رسانه‌ای است که فراتر از تحلیل ادبی به مطالعات صدا حرکت می‌کند. با این حال، چارچوب به طور آشکاری در مورد علم شناختی گوش دادن در مقابل خواندن ضعیف است. آن‌ها به پدیدارشناسی اشاره می‌کنند اما تحقیقات قوی در مورد درک روایت، حفظ حافظه و تصویرسازی ذهنی در بین حالت‌های مختلف (مانند کار دیوید سی. روبین یا انجمن بین‌المللی مطالعه تجربی ادبیات) را نادیده می‌گیرند. این یک حذف حیاتی است. آیا درک واقعاً مشابه است؟ آیا صدای راوی مانع ساخت تخیل می‌شود یا آن را تقویت می‌کند؟ مقاله این سوالات را مطرح می‌کند اما هیچ تکیه‌گاه تجربی ارائه نمی‌دهد و بر تمایز نظری به جای تفاوت قابل اندازه‌گیری تکیه می‌کند.

بینش‌های عملی: برای ناشران، بینش این است که از تولید کتاب‌های صوتی به عنوان ترجمه‌های صوتی صرف دست بردارند. در طراحی صدا سرمایه‌گذاری کنند، قالب‌های سریالی مشابه پادکست را در نظر بگیرند و به «چندوظیفه‌گر سیار» بازارسازی کنند. برای پژوهشگران، تکلیف روشن است: پژوهش آینده باید بین‌رشته‌ای باشد و این چارچوب نظری را با روش‌های تجربی از روانشناسی و علوم اعصاب پیوند دهد. پیشرفت بعدی در تعریف تجربه نخواهد بود، بلکه در سنجش تأثیر آن خواهد بود.

6. ملاحظات فنی و روش‌شناختی

نویسندگان از یک استراتژی روش‌شناختی تأکید بر تفاوت‌ها برای روشن کردن تجربیات متمایز استفاده می‌کنند و اذعان می‌کنند که شیوه‌های دنیای واقعی پیچیده‌تر و به هم پیوسته‌تر هستند.

جزئیات فنی و صورت‌گرایی: اگرچه این یک مقاله فنی نیست، اما تجربه را می‌توان مدل کرد. مصرف خطی و زمان‌مند یک کتاب صوتی را می‌توان با دسترسی غیرخطی چاپ مقایسه کرد. اگر یک روایت را به عنوان دنباله‌ای از رویدادها $N = \{e_1, e_2, ..., e_n\}$ در نظر بگیریم، خواندن چاپی اجازه یک تابع دسترسی غیرترتیبی $f_{print}(t) \rightarrow e_i$ را می‌دهد که در آن $i$ می‌تواند هر اندیسی باشد. گوش دادن به کتاب صوتی یک تابع ترتیبی $f_{audio}(t) \rightarrow e_{k(t)}$ را تحمیل می‌کند که در آن $k(t)$ یک تابع یکنوا از زمان است، که توسط سرعت پخش دیکته می‌شود. این محدودیت بنیادی، تجربه را شکل می‌دهد.

مثال چارچوب تحلیل (غیرکد): برای تحلیل یک اقتباس کتاب صوتی، ممکن است از چارچوب زیر استفاده کرد:

تحلیل پیرامتنی: بررسی انتخاب راوی، طرح جلد صوتی و فراداده‌های پلتفرم (مانند «شامل مصاحبه اختصاصی با نویسنده»).
تحلیل اجرا: ارزیابی ارائه صوتی (سرعت، زیروبمی، تمایز شخصیت)، استفاده از سکوت و لحن عاطفی.
تحلیل بافتاری: در نظر گرفتن سناریوهای معمول گوش دادن (مانند ماشین، باشگاه) و چگونگی تأثیر آن‌ها بر دریافت.
تحلیل تطبیقی: مقایسه نقدهای شنوندگان در پلتفرم‌هایی مانند Audible با نقدهای خوانندگان نسخه چاپی در Goodreads، با جستجوی بازخوردهای خاص حالت.

نتایج تجربی و توصیف نمودار: اگرچه خود مقاله هیچ آزمایش جدیدی ارائه نمی‌دهد، اما با نتایج نظرسنجی‌هایی مانند داده‌های APA 2006 همسو است. یک نمودار فرضی که از تز آن‌ها حمایت می‌کند می‌تواند یک نمودار دو محوره باشد که نشان می‌دهد: 1) محور Y اولیه: نرخ رشد سالانه فروش کتاب‌های صوتی (منحنی صعودی تند پس از 2005). 2) محور Y ثانویه: درصد مصرف کتاب صوتی که در حین «فعالیت‌های سیار» مانند رفت‌وآمد یا ورزش رخ می‌دهد (میله‌ای به طور مداوم بالا، مثلاً >70%). این نمودار به صورت بصری استدلال می‌کند که رشد به استفاده سیار و موقعیتی گره خورده است.

7. کاربردهای آینده و جهت‌گیری‌های پژوهشی

صوت غوطه‌ورکننده و تعاملی: آینده در بهره‌گیری از صدای فضایی سه‌بعدی (صدای دوگوشی) و ساختارهای روایی تعاملی (مشابه پادکست‌های «سرنوشت خود را انتخاب کن» یا داستان‌های تعاملی هدایت‌شده توسط هوش مصنوعی) نهفته است. پلتفرم‌هایی مانند «Audible Originals» در حال حاضر در حال کاوش این مرز هستند.

روایت شخصی‌سازی شده: پیشرفت‌ها در متن‌به‌گفتار با وفاداری بالا (TTS) و شبیه‌سازی صدا با هوش مصنوعی (مشاهده پژوهش از شرکت‌هایی مانند Respeecher یا VALL-E مایکروسافت) می‌تواند راویان شخصی‌سازی شده‌ای را ممکن سازد که لحن، سرعت یا حتی گویش را بر اساس ترجیح شنونده تنظیم می‌کنند.

ادغام با دستگاه‌های چندوجهی: پژوهش باید تغییر یکپارچه بین صوت و متن روی دستگاه‌هایی مانند عینک‌های هوشمند یا کتابخوان‌های جوهر الکترونیکی را بررسی کند و یک تجربه خواندن/گوش دادن ترکیبی ایجاد کند که نقاط قوت هر دو حالت را به کار گیرد.

مطالعات شناختی و تجربی: حیاتی‌ترین جهت، پژوهش تجربی است که درک، القای همدلی و شکل‌گیری حافظه بلندمدت را بین مصرف صوت و چاپ مقایسه می‌کند و عواملی مانند پیچیدگی روایت و تخصص شنونده/خواننده را کنترل می‌کند.

8. منابع

Pedersen, B. S., & Have, I. (2012). Conceptualising the audiobook experience. SoundEffects, 2(2), 80-92.
Rubery, M. (Ed.). (2011). Audiobooks, Literature, and Sound Studies. Routledge.
Audio Publishers Association (APA). (2006). Sales Survey.
Nielsen, L. B. (2012). Audiobook lending in Danish libraries. Danish Library Authority.
Rubin, D. C. (1995). Memory in Oral Traditions: The Cognitive Psychology of Epic, Ballads, and Counting-Out Rhymes. Oxford University Press.
International Society for the Empirical Study of Literature (IGEL). (n.d.). Research Publications. Retrieved from https://www.igel.news/
Microsoft Research. (2023). VALL-E: Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers. arXiv:2301.02111