1. 引言:重新思考有聲書
有聲書現象雖然並非新鮮事物,但在過去十年間,其製作、發行與接收方式經歷了根本性的轉變。Pedersen 與 Have 在本文中主張,應對有聲書體驗進行根本性的重新概念化,超越將其視為印刷書籍的單純「媒介再現」。相反,他們提出應將其視為一種獨特的文學實踐——「用耳朵閱讀」——並應將其理解為數位技術所促成的、更廣泛的移動聆聽實踐的延續。
2. 有聲書的歷史演進
有聲書的歷史揭示了其從特定群體的輔助工具轉變為主流媒體消費的過程。
2.1 早期發展 (1877-1970)
托馬斯·愛迪生的留聲機(1877年)最初旨在用於語音錄製。早期的口語錄音相當罕見。到了1930年代,英國和美國出現了長篇小說錄音,主要作為服務視障人士(包括一戰士兵)的管道。二戰後期,盤式錄音帶技術問世,但設備笨重(例如一本書需要20卷磁帶)。「有聲書」一詞隨著1970年代卡式錄音帶的普及而進入日常用語。
2.2 數位轉型 (1980-至今)
1980年代引入了光碟(CD)。一個關鍵轉折點發生在2002年,當時開始提供可下載的MP3格式有聲書。這一數位飛躍——例如將托爾斯泰的《戰爭與和平》儲存在iPod上,而非119張唱片上——極大地提升了可及性與便攜性,推動了該媒介的普及。
關鍵統計數據
- 用戶人口統計(美國有聲書出版協會,2006年): 與印刷書籍購買者相比,有聲書用戶更年輕、更富裕,且男性比例更高(佔購買者的50%)。
- 市場成長(丹麥): 銷售額在2009年至2010年間成長超過100%。自2009年起,丹麥圖書館每年新增50,000至60,000本有聲書。
- 普及度: 在整體閱讀人口下降的背景下,聆聽有聲書是少數幾種普及度仍在上升的閱讀實踐之一。
3. 理論框架
核心論點認為,聆聽有聲書與閱讀印刷文本是兩種根本不同的體驗,因此需要其自身的概念框架。
3.1 用眼睛閱讀 vs. 用耳朵閱讀
作者區分了接觸文學的兩種感官模式。「用眼睛閱讀」涉及視覺解碼、自我調節的導覽以及與文本的空間互動。「用耳朵閱讀」則是一種時間性、線性的體驗,由敘述者的節奏、語調和表演所主導。這種從空間控制到時間控制的轉變,改變了與敘事之間的認知及現象學互動。
3.2 超越媒介再現
本文批判了僅將有聲書視為印刷品的「媒介再現」(一種媒介在另一種媒介中的再現)來討論的傾向。這種觀點低估了聽覺媒介的獨特功能,例如聲音表演、環境音效的整合,以及創造親密、沉浸式的音景。
3.3 移動聆聽實踐
此框架將有聲書消費與移動聆聽的生態系統(例如音樂、播客)聯繫起來。聆聽行為常發生在次要活動期間(通勤、運動),使其成為一種多工、具身化的日常實踐,這與通常需要專注的印刷品閱讀活動不同。
4. 市場與使用趨勢
數位格式使有聲書聽眾民主化並擴大了其範圍。它不再主要與兒童、閱讀障礙或視力障礙相關聯。透過智慧型手機串流和下載的便利性,吸引了更廣泛、更年輕且更多元的用戶群體,將文學消費整合到移動、隨時隨地的生活方式中。
5. 分析框架:核心見解與批判
核心見解: Pedersen 與 Have 的開創性貢獻在於,強有力地將有聲書從其相對於印刷品的「窮親戚」地位中解耦。他們正確地指出,該媒介的爆炸性成長不僅是技術性的,更是體驗性的。這不是你聽到的書;這是一種源自文學與移動音頻文化結合的新敘事形式。
邏輯脈絡: 他們的論證優雅地建構:1) 歷史化以展示該媒介從醫療輔助到大眾媒體的演變。2) 解構「媒介再現」的謬誤。3) 確立「用耳朵閱讀」的典範。4) 將其置於移動聆聽的脈絡中。此脈絡具有說服力,但也揭示了其自身的偏見。
優點與缺陷: 其優點在於及時、針對媒介特性的關注,超越了文學分析而進入聲音研究領域。然而,該框架在聆聽與閱讀的認知科學方面明顯薄弱。他們提及現象學,卻忽略了關於跨模式敘事理解、記憶保留和心理意象的穩健研究(例如 David C. Rubin 的研究或國際文學實證研究學會的工作)。這是一個關鍵的疏漏。理解過程真的類似嗎?敘述者的聲音是抑制還是增強了想像力的建構?本文提出了這些問題,但沒有提供實證依據,依賴理論區分而非可測量的差異。
可行見解: 對出版商而言,見解是停止將有聲書製作成單純的音頻翻譯。應投資於聲音設計,考慮類似播客的連載格式,並向「移動多工者」行銷。對學者而言,方向很明確:未來的研究必須是跨學科的,將此理論框架與心理學和神經科學的實證方法相結合。下一個突破將不在於定義體驗,而在於量化其影響。
6. 技術與方法論考量
作者採用了強調差異的方法論策略,以釐清不同的體驗,同時承認現實世界的實踐更為複雜且相互關聯。
技術細節與形式主義: 雖然這不是一篇技術論文,但體驗可以被模型化。有聲書的線性、時間約束的消費模式,可以與印刷品的非線性存取形成對比。如果我們將敘事視為事件序列 $N = \{e_1, e_2, ..., e_n\}$,印刷閱讀允許非順序存取函數 $f_{print}(t) \rightarrow e_i$,其中 $i$ 可以是任何索引。有聲書聆聽則強制執行順序函數 $f_{audio}(t) \rightarrow e_{k(t)}$,其中 $k(t)$ 是時間的單調函數,由播放速度決定。這個根本性的限制塑造了體驗。
分析框架範例(非程式碼): 要分析有聲書改編,可以使用以下框架:
- 副文本分析: 檢視敘述者選擇、音頻封面藝術,以及平台元數據(例如「包含獨家作者訪談」)。
- 表演分析: 評估聲音演繹(節奏、音高、角色區分)、靜默的使用以及情感基調。
- 脈絡分析: 考量典型的聆聽情境(例如車內、健身房)及其可能如何影響接收。
- 比較分析: 對比 Audible 等平台上的聽眾評論與 Goodreads 上印刷版本的讀者評論,尋找模式特定的回饋。
實驗結果與圖表描述: 儘管本文本身未提出新的實驗,但它與美國有聲書出版協會2006年數據等調查結果相符。一個支持其論點的可能圖表可以是雙軸圖,顯示:1) 主Y軸: 有聲書年銷售成長率(2005年後呈現陡峭上升曲線)。2) 次Y軸: 在「移動活動」(如通勤或運動)期間消費有聲書的百分比(持續維持高水準,例如 >70%)。該圖表將視覺化地論證,成長與移動、情境化的使用息息相關。
7. 未來應用與研究方向
沉浸式與互動式音頻: 未來在於利用3D空間音頻(雙耳聲音)和互動式敘事結構(類似「選擇你自己的冒險」播客或AI驅動的互動小說)。像 Audible 的「Audible Originals」等平台已在探索此領域。
個人化敘述: 高保真文字轉語音(TTS)和AI語音克隆技術的進步(參見 Respeecher 或微軟 VALL-E 等公司的研究),可能實現個人化敘述者,根據聽眾偏好調整語調、速度甚至方言。
與多模態設備整合: 研究應探索在智慧眼鏡或電子紙閱讀器等設備上,無縫切換音頻與文本,創造一種結合兩種模式優勢的混合閱讀/聆聽體驗。
認知與實證研究: 最關鍵的方向是進行實證研究,比較音頻與印刷消費之間的理解力、同理心誘發和長期記憶形成,並控制敘事複雜度、聽眾/讀者專業程度等因素。
8. 參考文獻
- Pedersen, B. S., & Have, I. (2012). Conceptualising the audiobook experience. SoundEffects, 2(2), 80-92.
- Rubery, M. (Ed.). (2011). Audiobooks, Literature, and Sound Studies. Routledge.
- Audio Publishers Association (APA). (2006). Sales Survey.
- Nielsen, L. B. (2012). Audiobook lending in Danish libraries. Danish Library Authority.
- Rubin, D. C. (1995). Memory in Oral Traditions: The Cognitive Psychology of Epic, Ballads, and Counting-Out Rhymes. Oxford University Press.
- International Society for the Empirical Study of Literature (IGEL). (n.d.). Research Publications. Retrieved from https://www.igel.news/
- Microsoft Research. (2023). VALL-E: Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers. arXiv:2301.02111