Концептуализация опыта аудиокниг: теоретическая основа

1. Введение: Переосмысление аудиокниги

Феномен аудиокниг, хотя и не новый, претерпел радикальные изменения в производстве, распространении и восприятии за последнее десятилетие. В этой статье Педерсен и Хаве выступают за фундаментальную переконцептуализацию опыта аудиокниг, выходя за рамки восприятия их как простой ремедиации печатной книги. Вместо этого они предлагают рассматривать их как отдельную литературную практику — «чтение ушами», — которую следует понимать в контексте более широких практик мобильного прослушивания, ставших возможными благодаря цифровым технологиям.

2. Историческая эволюция аудиокниг

История аудиокниг демонстрирует переход от вспомогательных инструментов для специфических групп к потреблению массовых медиа.

2.1 Раннее развитие (1877-1970)

Фонограф Томаса Эдисона (1877) изначально предназначался для записи речи. Ранние записи устной речи были редкостью. К 1930-м годам в Великобритании и США появились записи романов, в основном как услуга для слепых, включая солдат Первой мировой войны. В послевоенную эпоху появилась катушечная технология с громоздкими установками (например, 20 катушек для одной книги). Термин «аудиокнига» вошел в обиход с появлением аудиокассеты в 1970-х годах.

2.2 Цифровая трансформация (1980-настоящее время)

В 1980-х годах появился компакт-диск (CD). Ключевой сдвиг произошел в 2002 году с появлением загружаемых аудиокниг в формате MP3. Этот цифровой скачок, примером которого является хранение «Войны и мира» Толстого на iPod против 119 пластинок, кардинально улучшил доступность и портативность, подстегнув популярность этого медиума.

Ключевая статистика

Демография пользователей (APA, 2006): Пользователи аудиокниг моложе, более обеспечены и включают более высокую долю мужчин (50% покупателей) по сравнению с покупателями печатных книг.
Рост рынка (Дания): Продажи выросли более чем на 100% с 2009 по 2010 год. С 2009 года в датские библиотеки ежегодно добавляется 50 000–60 000 новых аудиокниг.
Популярность: Прослушивание аудиокниг входит в число немногих практик чтения, популярность которых растет на фоне общего снижения читательской аудитории.

3. Теоретическая основа

Основной тезис заключается в том, что прослушивание аудиокниги представляет собой принципиально иной опыт по сравнению с чтением печатного текста, что требует собственной концептуальной основы.

3.1 Чтение глазами vs. Чтение ушами

Авторы различают две сенсорные модальности взаимодействия с литературой. «Чтение глазами» предполагает визуальное декодирование, самостоятельную навигацию в своем темпе и пространственное взаимодействие с текстом. «Чтение ушами» — это временной, линейный опыт, определяемый темпом, тоном и исполнением чтеца. Этот переход от пространственного к временному контролю меняет когнитивное и феноменологическое взаимодействие с повествованием.

3.2 За пределами ремедиации

В статье критикуется тенденция обсуждать аудиокниги исключительно как ремедиацию (представление одного медиума в другом) печатного текста. Эта точка зрения недооценивает уникальные возможности аудиосреды, такие как голосовое исполнение, интеграция фоновых звуков и создание интимного, погружающего звукового ландшафта.

3.3 Практики мобильного прослушивания

Данная основа связывает потребление аудиокниг с экосистемой мобильного прослушивания (например, музыки, подкастов). Прослушивание часто происходит во время второстепенных занятий (поездка на работу, тренировка), что делает его многозадачной, воплощенной практикой, встроенной в повседневную жизнь, в отличие от обычно выделенного времени для чтения печатных книг.

4. Рыночные тенденции и практики использования

Цифровой формат демократизировал и расширил аудиторию аудиокниг. Они больше не ассоциируются преимущественно с детьми, дислексией или нарушениями зрения. Удобство потоковой передачи и загрузки через смартфоны привлекло более широкую, молодую и разнообразную пользовательскую базу, интегрировав литературное потребление в мобильный, динамичный образ жизни.

5. Аналитическая основа: Ключевой вывод и критика

Ключевой вывод: Основной вклад Педерсена и Хаве заключается в решительном отделении аудиокниги от статуса «бедного родственника» печатной книги. Они верно отмечают, что взрывной рост этого медиума обусловлен не только технологиями, но и опытом. Это не книга, которую ты слышишь; это новая повествовательная форма, рожденная от союза литературы и мобильной аудиокультуры.

Логическая последовательность: Их аргументация выстроена элегантно: 1) Историзация, чтобы показать эволюцию медиума от вспомогательного средства до масс-медиа. 2) Деконструкция «ремедиационной» ошибки. 3) Постулирование парадигмы «чтения ушами». 4) Контекстуализация в рамках мобильного прослушивания. Эта последовательность убедительна, но выявляет собственную предвзятость.

Сильные стороны и недостатки: Сильная сторона — своевременный, специфичный для медиа фокус, выходящий за рамки литературного анализа в область звуковых исследований. Однако в основе явно недостаточно внимания уделено когнитивной науке слушания в сравнении с чтением. Они ссылаются на феноменологию, но игнорируют обширные исследования по пониманию нарратива, удержанию в памяти и ментальным образам в разных модальностях (например, работы Дэвида К. Рубина или Международного общества эмпирического изучения литературы). Это критическое упущение. Действительно ли понимание аналогично? Подавляет или усиливает голос чтеца создание воображаемых образов? Статья поднимает эти вопросы, но не дает эмпирической основы, полагаясь на теоретическое различие, а не на измеримую разницу.

Практические выводы: Для издателей вывод заключается в том, чтобы перестать выпускать аудиокниги как простые аудиопереводы. Инвестировать в звуковой дизайн, рассматривать сериализованные форматы, подобные подкастам, и ориентировать маркетинг на «мобильного многозадачника». Для ученых задача ясна: будущие исследования должны быть междисциплинарными, сочетая эту теоретическую основу с эмпирическими методами психологии и нейронауки. Следующий прорыв будет не в определении опыта, а в количественной оценке его воздействия.

6. Технические и методологические аспекты

Авторы используют методологическую стратегию акцентирования различий для прояснения уникального опыта, признавая, что реальные практики более сложны и взаимосвязаны.

Технические детали и формализм: Хотя это не техническая статья, опыт можно смоделировать. Линейное, ограниченное по времени потребление аудиокниги можно противопоставить нелинейному доступу к печатному тексту. Если рассматривать повествование как последовательность событий $N = \{e_1, e_2, ..., e_n\}$, чтение печатного текста позволяет использовать нелинейную функцию доступа $f_{print}(t) \rightarrow e_i$, где $i$ может быть любым индексом. Прослушивание аудиокниги навязывает последовательную функцию $f_{audio}(t) \rightarrow e_{k(t)}$, где $k(t)$ — монотонная функция времени, определяемая скоростью воспроизведения. Это фундаментальное ограничение формирует опыт.

Пример аналитической основы (не код): Для анализа адаптации аудиокниги можно использовать следующую основу:

Анализ паратекста: Изучить выбор чтеца, аудиообложку и метаданные платформы (например, «Включает эксклюзивное интервью с автором»).
Анализ исполнения: Оценить голосовую подачу (темп, высота тона, различие персонажей), использование пауз и эмоциональный тон.
Контекстуальный анализ: Учесть типичные сценарии прослушивания (например, машина, спортзал) и их возможное влияние на восприятие.
Сравнительный анализ: Сопоставить отзывы слушателей на платформах вроде Audible с отзывами читателей печатной версии на Goodreads, обращая внимание на отзывы, специфичные для модальности.

Экспериментальные результаты и описание графика: Хотя сама статья не представляет новых экспериментов, она согласуется с результатами опросов, такими как данные APA 2006. Гипотетический график, подтверждающий их тезис, мог бы представлять собой график с двумя осями, показывающий: 1) Основная ось Y: Годовой темп роста продаж аудиокниг (крутой восходящий тренд после 2005 года). 2) Вторичная ось Y: Процент потребления аудиокниг во время «мобильных активностей», таких как поездка на работу или занятия спортом (стабильно высокий показатель, например, >70%). График визуально аргументировал бы, что рост связан с мобильным, ситуативным использованием.

7. Будущие применения и направления исследований

Иммерсивное и интерактивное аудио: Будущее заключается в использовании 3D пространственного звука (бинауральный звук) и интерактивных нарративных структур (аналогичных подкастам «выбери свое приключение» или интерактивной фантастике на основе ИИ). Платформы вроде «Audible Originals» уже исследуют эту область.

Персонализированное озвучивание: Достижения в области высококачественного преобразования текста в речь (TTS) и клонирования голоса с помощью ИИ (см. исследования таких компаний, как Respeecher, или Microsoft VALL-E) могут позволить создавать персонализированных чтецов, настраивающих тон, скорость или даже диалект в соответствии с предпочтениями слушателя.

Интеграция с мультимодальными устройствами: Исследования должны изучать возможность плавного переключения между аудио и текстом на таких устройствах, как умные очки или e-ink ридеры, создавая гибридный опыт чтения/прослушивания, использующий сильные стороны обеих модальностей.

Когнитивные и эмпирические исследования: Наиболее критическое направление — эмпирические исследования, сравнивающие понимание, индукцию эмпатии и формирование долговременной памяти при потреблении аудио и печатного текста, с контролем таких факторов, как сложность повествования и опыт слушателя/читателя.

8. Ссылки

Pedersen, B. S., & Have, I. (2012). Conceptualising the audiobook experience. SoundEffects, 2(2), 80-92.
Rubery, M. (Ed.). (2011). Audiobooks, Literature, and Sound Studies. Routledge.
Audio Publishers Association (APA). (2006). Sales Survey.
Nielsen, L. B. (2012). Audiobook lending in Danish libraries. Danish Library Authority.
Rubin, D. C. (1995). Memory in Oral Traditions: The Cognitive Psychology of Epic, Ballads, and Counting-Out Rhymes. Oxford University Press.
International Society for the Empirical Study of Literature (IGEL). (n.d.). Research Publications. Retrieved from https://www.igel.news/
Microsoft Research. (2023). VALL-E: Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers. arXiv:2301.02111