選擇語言

AudioBoost:透過LLM生成合成查詢提升Spotify搜尋中嘅有聲書發現能力

研究使用大型語言模型生成合成查詢,改善Spotify搜尋系統中有聲書嘅可檢索性,透過查詢自動完成同檢索增強解決冷啟動問題。
audio-novel.com | PDF Size: 0.6 MB
評分: 4.5/5
您的評分
您已經為此文檔評過分
PDF文檔封面 - AudioBoost:透過LLM生成合成查詢提升Spotify搜尋中嘅有聲書發現能力

目錄

1. 引言

Spotify引入有聲書後產生咗嚴重嘅冷啟動問題,新內容相比成熟嘅音樂同播客內容可檢索性較低。AudioBoost系統透過利用大型語言模型生成合成查詢,同時增強查詢制定同檢索能力,解決呢個挑戰。

關鍵性能指標

  • 有聲書曝光量:+0.7%
  • 有聲書點擊率:+1.22%
  • 探索性查詢完成率:+1.82%

2. 方法論

2.1 合成查詢生成

AudioBoost使用以有聲書元數據為條件嘅LLM,生成涵蓋主題、類型、故事套路同年代嘅多元化探索性查詢。生成過程遵循結構化提示工程方法,確保查詢質量同相關性。

2.2 查詢自動完成整合

合成查詢被整合到Spotify嘅查詢自動完成系統中,激勵用戶輸入更多探索性查詢,解決用戶搜索行為同有聲書內容之間嘅詞彙不匹配問題。

2.3 檢索系統增強

生成嘅查詢被索引到Spotify嘅搜索檢索引擎中,為有聲書創造額外嘅發現途徑,通過更廣泛、基於主題嘅搜索而不僅僅係精確標題匹配。

3. 技術實現

3.1 數學框架

可檢索性改進可以使用概率框架建模:$P(r|q,d) = \frac{\exp(\text{sim}(q,d))}{\sum_{d' \in D} \exp(\text{sim}(q,d'))}$,其中$q$代表查詢,$d$代表文檔,$\text{sim}$係相似度函數。合成查詢生成旨在最大化$\sum_{q \in Q_{\text{syn}}} P(r|q,d_{\text{audiobook}})$。

3.2 代碼實現

class AudioBoostQueryGenerator:
    def __init__(self, llm_model, metadata_fields):
        self.llm = llm_model
        self.fields = metadata_fields
    
    def generate_queries(self, audiobook_data, num_queries=10):
        prompt = self._construct_prompt(audiobook_data)
        synthetic_queries = self.llm.generate(
            prompt=prompt,
            max_tokens=50,
            num_return_sequences=num_queries
        )
        return self._filter_queries(synthetic_queries)
    
    def _construct_prompt(self, data):
        return f"""Generate diverse search queries for audiobook:
        Title: {data['title']}
        Author: {data['author']}
        Genre: {data['genre']}
        Themes: {data['themes']}
        Generate exploratory queries about topics, similar books, mood:"""

4. 實驗結果

4.1 離線評估

離線評估顯示有聲書可檢索性指標有顯著改善。合成查詢相比單獨有機查詢覆蓋率提高35%,質量分數喺人工評估尺度上超過0.85。

4.2 在線A/B測試

涉及數百萬用戶嘅在線A/B測試顯示統計學上顯著嘅改善:有聲書曝光量+0.7%,有聲書點擊率+1.22%,探索性查詢完成率+1.82%,驗證咗AudioBoost方法嘅有效性。

5. 未來應用

AudioBoost方法可以擴展到內容平台嘅其他冷啟動場景,包括新播客節目、新興音樂類型同視頻內容。未來工作包括基於用戶收聽歷史個性化合成查詢,同整合多模態內容理解。

專家分析:內容發現中嘅冷啟動難題

AudioBoost代表咗對推薦系統中最持久問題之一嘅務實解決方案:冷啟動困境。該方法通過利用LLM作為合成用戶代理,巧妙咁橋接有限用戶互動同全面內容發現之間嘅差距。呢種方法同計算機視覺中嘅類似技術一致,其中CycleGAN風格嘅領域轉換已被用於為代表性不足類別生成訓練數據[Zhu et al., 2017]。

技術實現展示咗對搜索生態系統動態嘅深刻理解。通過同時針對查詢制定(透過QAC)同檢索,AudioBoost創造咗一個良性循環,其中改進嘅建議導致更好嘅查詢,從而提高檢索性能。呢種雙重方法令人聯想到強化學習系統,其中動作同觀察空間被同時優化[Sutton & Barto, 2018]。

然而,論文最重要嘅貢獻可能係展示咗LLM在生產系統中嘅實際部署。雖然好多LLM研究專注於基準性能,但AudioBoost展示咗這些模型如何在實際應用中推動具體業務指標。探索性查詢增加1.82%表明系統成功推動用戶行為朝向更以發現為導向嘅搜索模式,解決咗根本嘅冷啟動挑戰。

該方法可以通過將用戶特定因素納入查詢生成來進一步增強,類似現代推薦系統基於個人偏好個性化內容嘅方式[Ricci et al., 2011]。此外,音頻內容分析嘅整合可以為查詢生成提供另一個維度,超越元數據到實際內容理解。

6. 參考文獻

  1. Zhu, J. Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired image-to-image translation using cycle-consistent adversarial networks. Proceedings of the IEEE international conference on computer vision.
  2. Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.
  3. Ricci, F., Rokach, L., & Shapira, B. (2011). Introduction to recommender systems handbook. Springer.
  4. Palumbo, E., et al. (2025). AudioBoost: Increasing Audiobook Retrievability in Spotify Search with Synthetic Query Generation. EARL Workshop@RecSys.

行業分析師觀點

一針見血: AudioBoost唔只係另一個AI實驗——佢係對困擾內容平台幾十年嘅冷啟動問題嘅精準打擊。Spotify使用LLM唔係作為聊天機械人,而係作為戰略武器來重塑用戶行為同內容發現經濟學。

邏輯鏈條: 因果鏈被巧妙設計:有限有聲書互動 → 合成查詢生成 → 改進QAC建議 → 用戶行為修改 → 增加探索性查詢 → 增強有聲書可檢索性 → 業務指標改善。呢個創造咗一個自我強化嘅發現循環,從根本上改變內容曝光格局。

亮點與槽點: 突出創新係在查詢建議同檢索系統中嘅雙重部署——大多數公司會只做其中一個。探索性查詢提升1.82%展示咗實際行為改變,而不僅僅係算法優化。然而,該方法風險創建一個脫離真實用戶意圖嘅人工查詢生態系統,論文冇解決潛在查詢質量隨時間下降嘅問題。

行動啟示: 對於產品領導者:呢個展示咗LLM應用應該專注於生態系統級別干預而非點解決方案。對於工程師:真正教訓在於將學術技術生產化——注意佢哋如何使用已建立指標而非追求新穎評估框架。下一個前沿將係在保持發現多樣性嘅同時個性化這些合成查詢。