Pilih Bahasa

AudioBoost: Meningkatkan Penemuan Buku Audio dalam Carian Spotify melalui Kueri Sintetik Terjana LLM

Kajian penggunaan Model Bahasa Besar untuk menjana kueri sintetik bagi meningkatkan kebolehcapaitan buku audio dalam sistem carian Spotify, menangani cabaran permulaan sejuk melalui pelengkapan automatik kueri dan peningkatan penarikan balik.
audio-novel.com | PDF Size: 0.6 MB
Penilaian: 4.5/5
Penilaian Anda
Anda sudah menilai dokumen ini
Sampul Dokumen PDF - AudioBoost: Meningkatkan Penemuan Buku Audio dalam Carian Spotify melalui Kueri Sintetik Terjana LLM

Isi Kandungan

1. Pengenalan

Pengenalan buku audio oleh Spotify mencipta masalah permulaan sejuk yang ketara di mana kandungan baharu mengalami kebolehcapaitan rendah berbanding tawaran muzik dan podcast yang mantap. Sistem AudioBoost menangani cabaran ini dengan memanfaatkan Model Bahasa Besar untuk menjana kueri sintetik yang meningkatkan kedua-dua keupayaan perumusan kueri dan penarikan balik.

Metrik Prestasi Utama

  • Impresi Buku Audio: +0.7%
  • Klik Buku Audio: +1.22%
  • Pelengkapan Kueri Eksploratori: +1.82%

2. Metodologi

2.1 Penjanaan Kueri Sintetik

AudioBoost menggunakan LLM yang dikondisikan pada metadata buku audio untuk menjana kueri eksploratori yang pelbagai merangkumi topik, genre, tropa cerita, dan dekad. Proses penjanaan mengikuti pendekatan kejuruteraan prompt berstruktur untuk memastikan kualiti dan relevan kueri.

2.2 Integrasi Pelengkapan Automatik Kueri

Kueri sintetik disepadukan ke dalam sistem Pelengkapan Automatik Kueri Spotify untuk mendorong pengguna menaip lebih banyak kueri eksploratori, menangani ketidaksesuaian kosa kata antara tingkah laku carian pengguna dan kandungan buku audio.

2.3 Peningkatan Sistem Penarikan Balik

Kueri yang dijana diindeks dalam enjin carian penarikan balik Spotify, mencipta laluan tambahan untuk buku audio ditemui melalui carian berasaskan topik yang lebih luas dan bukan hanya padanan tajuk tepat.

3. Pelaksanaan Teknikal

3.1 Kerangka Matematik

Peningkatan kebolehcapaitan boleh dimodelkan menggunakan kerangka kebarangkalian: $P(r|q,d) = \frac{\exp(\text{sim}(q,d))}{\sum_{d' \in D} \exp(\text{sim}(q,d'))}$ di mana $q$ mewakili kueri, $d$ mewakili dokumen, dan $\text{sim}$ ialah fungsi keserupaan. Penjanaan kueri sintetik bertujuan untuk memaksimumkan $\sum_{q \in Q_{\text{syn}}} P(r|q,d_{\text{audiobook}})$.

3.2 Pelaksanaan Kod

class AudioBoostQueryGenerator:
    def __init__(self, llm_model, metadata_fields):
        self.llm = llm_model
        self.fields = metadata_fields
    
    def generate_queries(self, audiobook_data, num_queries=10):
        prompt = self._construct_prompt(audiobook_data)
        synthetic_queries = self.llm.generate(
            prompt=prompt,
            max_tokens=50,
            num_return_sequences=num_queries
        )
        return self._filter_queries(synthetic_queries)
    
    def _construct_prompt(self, data):
        return f"""Generate diverse search queries for audiobook:
        Title: {data['title']}
        Author: {data['author']}
        Genre: {data['genre']}
        Themes: {data['themes']}
        Generate exploratory queries about topics, similar books, mood:"""

4. Keputusan Eksperimen

4.1 Penilaian Luar Talian

Penilaian luar talian menunjukkan peningkatan ketara dalam metrik kebolehcapaitan buku audio. Kueri sintetik meningkatkan liputan sebanyak 35% berbanding kueri organik sahaja, dengan skor kualiti melebihi 0.85 pada skala penilaian manusia.

4.2 Ujian A/B Dalam Talian

Ujian A/B dalam talian yang melibatkan berjuta-juta pengguna menunjukkan peningkatan signifikan secara statistik: +0.7% dalam impresi buku audio, +1.22% dalam klik buku audio, dan +1.82% dalam pelengkapan kueri eksploratori, mengesahkan keberkesanan pendekatan AudioBoost.

5. Aplikasi Masa Depan

Metodologi AudioBoost boleh diperluaskan kepada senario permulaan sejuk lain dalam platform kandungan, termasuk rancangan podcast baharu, genre muzik baru, dan kandungan video. Kerja masa depan termasuk memperibadikan kueri sintetik berdasarkan sejarah pendengaran pengguna dan menyepadukan pemahaman kandungan multimodal.

Analisis Pakar: Teka-teki Permulaan Sejuk dalam Penemuan Kandungan

AudioBoost mewakili penyelesaian pragmatik kepada salah satu masalah paling berterusan dalam sistem cadangan: dilema permulaan sejuk. Pendekatan ini dengan bijak merapatkan jurang antara interaksi pengguna yang terhad dan penemuan kandungan yang komprehensif dengan memanfaatkan LLM sebagai proksi pengguna sintetik. Metodologi ini selaras dengan teknik serupa dalam penglihatan komputer, di mana terjemahan domain gaya CycleGAN telah digunakan untuk menjana data latihan untuk kelas yang kurang diwakili [Zhu et al., 2017].

Pelaksanaan teknikal menunjukkan pemahaman canggih tentang dinamik ekosistem carian. Dengan mensasarkan kedua-dua perumusan kueri (melalui QAC) dan penarikan balik secara serentak, AudioBoost mencipta kitaran baik di mana cadangan yang lebih baik membawa kepada kueri yang lebih baik, yang seterusnya meningkatkan prestasi penarikan balik. Pendekatan dual ini mengingatkan sistem pembelajaran pengukuhan di mana ruang tindakan dan pemerhatian dioptimumkan serentak [Sutton & Barto, 2018].

Walau bagaimanapun, sumbangan paling signifikan kertas ini mungkin demonstrasi penyebaran LLM praktikal dalam sistem pengeluaran. Walaupun banyak penyelidikan LLM memfokuskan pada prestasi penanda aras, AudioBoost menunjukkan bagaimana model ini boleh mendorong metrik perniagaan konkrit dalam aplikasi dunia sebenar. Peningkatan +1.82% dalam kueri eksploratori mencadangkan bahawa sistem berjaya mendorong tingkah laku pengguna ke arah corak carian yang lebih berorientasikan penemuan, menangani cabaran permulaan sejuk asas.

Pendekatan ini boleh dipertingkatkan lagi dengan menggabungkan faktor khusus pengguna ke dalam penjanaan kueri, serupa dengan bagaimana sistem pencadang moden memperibadikan kandungan berdasarkan keutamaan individu [Ricci et al., 2011]. Selain itu, integrasi analisis kandungan audio boleh memberikan dimensi lain untuk penjanaan kueri, bergerak melampaui metadata kepada pemahaman kandungan sebenar.

6. Rujukan

  1. Zhu, J. Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired image-to-image translation using cycle-consistent adversarial networks. Proceedings of the IEEE international conference on computer vision.
  2. Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.
  3. Ricci, F., Rokach, L., & Shapira, B. (2011). Introduction to recommender systems handbook. Springer.
  4. Palumbo, E., et al. (2025). AudioBoost: Increasing Audiobook Retrievability in Spotify Search with Synthetic Query Generation. EARL Workshop@RecSys.

Perspektif Penganalisis Industri

Tepat Pada Sasaran: AudioBoost bukan sekadar eksperimen AI lain—ia merupakan serangan tepat terhadap masalah permulaan sejuk yang telah membelenggu platform kandungan selama beberapa dekad. Spotify menggunakan LLM bukan sebagai bot sembang, tetapi sebagai senjata strategik untuk membentuk semula tingkah laku pengguna dan ekonomi penemuan kandungan.

Rantaian Kausal: Rantaian kausal direka dengan cemerlang: interaksi buku audio terhad → penjanaan kueri sintetik → cadangan QAC yang lebih baik → pengubahsuaian tingkah laku pengguna → peningkatan kueri eksploratori → peningkatan kebolehcapaitan buku audio → peningkatan metrik perniagaan. Ini mencipta gelung penemuan saling mengukuh yang mengubah landskap pendedahan kandungan secara asas.

Sorotan dan Kelemahan: Inovasi terkemuka ialah penyebaran dual dalam kedua-dua sistem cadangan kueri dan penarikan balik—kebanyakan syarikat akan berhenti pada satu sahaja. Peningkatan 1.82% dalam kueri eksploratori menunjukkan perubahan tingkah laku sebenar, bukan hanya pengoptimuman algoritma. Walau bagaimanapun, pendekatan ini berisiko mencipta ekosistem kueri buatan yang terpisah dari niat pengguna tulen, dan kertas ini tidak menangani potensi kemerosotan kualiti kueri dari masa ke masa.

Inspirasi Tindakan: Untuk pemimpin produk: ini menunjukkan bahawa aplikasi LLM harus memfokuskan pada intervensi peringkat ekosistem dan bukan penyelesaian titik. Untuk jurutera: pengajaran sebenar ialah dalam mengeluarkan teknik akademik—perhatikan bagaimana mereka menggunakan metrik mantap daripada mengejar kerangka penilaian novel. Sempadan seterusnya akan memperibadikan kueri sintetik ini sambil mengekalkan kepelbagaian penemuan.