भाषा चुनें

ऑडियोबूस्ट: एलएलएम-जनित सिंथेटिक क्वेरीज़ के माध्यम से स्पॉटिफाई खोज में ऑडियोबुक खोज को बढ़ाना

स्पॉटिफाई की खोज प्रणाली में ऑडियोबुक पुनर्प्राप्ति में सुधार के लिए बड़ी भाषा मॉडल का उपयोग करके सिंथेटिक क्वेरी उत्पन्न करने पर शोध, जो क्वेरी ऑटो-पूर्णता और पुनर्प्राप्ति वृद्धि के माध्यम से कोल्ड-स्टार्ट चुनौतियों का समाधान करता है।
audio-novel.com | PDF Size: 0.6 MB
रेटिंग: 4.5/5
आपकी रेटिंग
आपने पहले ही इस दस्तावेज़ को रेट कर दिया है
PDF दस्तावेज़ कवर - ऑडियोबूस्ट: एलएलएम-जनित सिंथेटिक क्वेरीज़ के माध्यम से स्पॉटिफाई खोज में ऑडियोबुक खोज को बढ़ाना

विषय सूची

1. परिचय

स्पॉटिफाई द्वारा ऑडियोबुक्स की शुरुआत ने एक महत्वपूर्ण कोल्ड-स्टार्ट समस्या पैदा की, जहाँ नई सामग्री स्थापित संगीत और पॉडकास्ट सेवाओं की तुलना में कम पुनर्प्राप्ति से ग्रस्त है। ऑडियोबूस्ट सिस्टम इस चुनौती का समाधान बड़ी भाषा मॉडल्स का लाभ उठाकर सिंथेटिक क्वेरी उत्पन्न करके करता है, जो क्वेरी निर्माण और पुनर्प्राप्ति क्षमताओं दोनों को बढ़ाता है।

मुख्य प्रदर्शन मेट्रिक्स

  • ऑडियोबुक इम्प्रेशन: +0.7%
  • ऑडियोबुक क्लिक: +1.22%
  • खोजपूर्ण क्वेरी पूर्णताएँ: +1.82%

2. कार्यप्रणाली

2.1 सिंथेटिक क्वेरी जनरेशन

ऑडियोबूस्ट ऑडियोबुक मेटाडेटा पर आधारित एलएलएम का उपयोग विविध खोजपूर्ण क्वेरी उत्पन्न करने के लिए करता है, जो विषयों, शैलियों, कहानी के ट्रोप्स और दशकों को कवर करती हैं। जनरेशन प्रक्रिया क्वेरी गुणवत्ता और प्रासंगिकता सुनिश्चित करने के लिए एक संरचित प्रॉम्प्ट इंजीनियरिंग दृष्टिकोण का पालन करती है।

2.2 क्वेरी ऑटो-पूर्णता एकीकरण

सिंथेटिक क्वेरीज़ को स्पॉटिफाई की क्वेरी ऑटो-पूर्णता प्रणाली में एकीकृत किया जाता है ताकि उपयोगकर्ताओं को अधिक खोजपूर्ण क्वेरी टाइप करने के लिए प्रेरित किया जा सके, जिससे उपयोगकर्ता खोज व्यवहार और ऑडियोबुक सामग्री के बीच शब्दावली का मिसमैच दूर होता है।

2.3 पुनर्प्राप्ति प्रणाली वृद्धि

उत्पन्न क्वेरीज़ को स्पॉटिफाई की खोज पुनर्प्राप्ति इंजन में अनुक्रमित किया जाता है, जिससे ऑडियोबुक्स के लिए केवल सटीक शीर्षक मिलान के बजाय व्यापक, विषय-आधारित खोजों के माध्यम से खोजे जाने के अतिरिक्त रास्ते बनते हैं।

3. तकनीकी कार्यान्वयन

3.1 गणितीय ढांचा

पुनर्प्राप्ति सुधार को संभाव्यता ढांचे का उपयोग करके मॉडल किया जा सकता है: $P(r|q,d) = \frac{\exp(\text{sim}(q,d))}{\sum_{d' \in D} \exp(\text{sim}(q,d'))}$ जहाँ $q$ क्वेरीज़ को, $d$ दस्तावेज़ों को और $\text{sim}$ समानता फलन को दर्शाता है। सिंथेटिक क्वेरी जनरेशन का लक्ष्य $\sum_{q \in Q_{\text{syn}}} P(r|q,d_{\text{audiobook}})$ को अधिकतम करना है।

3.2 कोड कार्यान्वयन

class AudioBoostQueryGenerator:
    def __init__(self, llm_model, metadata_fields):
        self.llm = llm_model
        self.fields = metadata_fields
    
    def generate_queries(self, audiobook_data, num_queries=10):
        prompt = self._construct_prompt(audiobook_data)
        synthetic_queries = self.llm.generate(
            prompt=prompt,
            max_tokens=50,
            num_return_sequences=num_queries
        )
        return self._filter_queries(synthetic_queries)
    
    def _construct_prompt(self, data):
        return f"""Generate diverse search queries for audiobook:
        Title: {data['title']}
        Author: {data['author']}
        Genre: {data['genre']}
        Themes: {data['themes']}
        Generate exploratory queries about topics, similar books, mood:"""

4. प्रायोगिक परिणाम

4.1 ऑफ़लाइन मूल्यांकन

ऑफ़लाइन मूल्यांकन ने ऑडियोबुक पुनर्प्राप्ति मेट्रिक्स में महत्वपूर्ण सुधार प्रदर्शित किया। सिंथेटिक क्वेरीज़ ने केवल ऑर्गेनिक क्वेरीज़ की तुलना में कवरेज में 35% की वृद्धि की, साथ ही मानव मूल्यांकन पैमानों पर गुणवत्ता स्कोर 0.85 से अधिक रहा।

4.2 ऑनलाइन ए/बी परीक्षण

लाखों उपयोगकर्ताओं को शामिल करने वाले ऑनलाइन ए/बी परीक्षण ने सांख्यिकीय रूप से महत्वपूर्ण सुधार दिखाए: ऑडियोबुक इम्प्रेशन में +0.7%, ऑडियोबुक क्लिक में +1.22%, और खोजपूर्ण क्वेरी पूर्णताओं में +1.82% की वृद्धि, जिसने ऑडियोबूस्ट दृष्टिकोण की प्रभावशीलता को सत्यापित किया।

5. भविष्य के अनुप्रयोग

ऑडियोबूस्ट कार्यप्रणाली को सामग्री प्लेटफार्मों में अन्य कोल्ड-स्टार्ट परिदृश्यों तक बढ़ाया जा सकता है, जिसमें नए पॉडकास्ट शो, उभरती संगीत शैलियाँ और वीडियो सामग्री शामिल हैं। भविष्य के कार्य में उपयोगकर्ता सुनने के इतिहास के आधार पर सिंथेटिक क्वेरीज़ को वैयक्तिकृत करना और मल्टीमॉडल सामग्री समझ को एकीकृत करना शामिल है।

विशेषज्ञ विश्लेषण: सामग्री खोज में कोल्ड-स्टार्ट की पहेली

ऑडियोबूस्ट सिफारिश प्रणालियों की सबसे लगातार समस्याओं में से एक - कोल्ड-स्टार्ट दुविधा - का एक व्यावहारिक समाधान प्रस्तुत करता है। यह दृष्टिकोण एलएलएम को सिंथेटिक उपयोगकर्ता प्रॉक्सी के रूप में उपयोग करके सीमित उपयोगकर्ता इंटरैक्शन और व्यापक सामग्री खोज के बीच की खाई को चतुराई से पाटता है। यह कार्यप्रणाली कंप्यूटर विजन में उपयोग की जाने वाली समान तकनीकों के अनुरूप है, जहाँ अंडररिप्रेजेंटेड क्लासेस के लिए ट्रेनिंग डेटा जनरेट करने के लिए साइकलजीएएन-स्टाइल डोमेन ट्रांसलेशन का उपयोग किया गया है [Zhu et al., 2017]।

तकनीकी कार्यान्वयन खोज पारिस्थितिकी तंत्र की गतिशीलता की परिष्कृत समझ प्रदर्शित करता है। क्वेरी निर्माण (क्यूएसी के माध्यम से) और पुनर्प्राप्ति दोनों को एक साथ लक्षित करके, ऑडियोबूस्ट एक सद्भावनापूर्ण चक्र बनाता है जहाँ बेहतर सुझाव बेहतर क्वेरी की ओर ले जाते हैं, जो बदले में पुनर्प्राप्ति प्रदर्शन में सुधार करते हैं। यह दोहरा दृष्टिकोण रीइन्फोर्समेंट लर्निंग सिस्टम की याद दिलाता है, जहाँ एक्शन और ऑब्जर्वेशन स्पेस को एक साथ ऑप्टिमाइज़ किया जाता है [Sutton & Barto, 2018]।

हालाँकि, पेपर का सबसे महत्वपूर्ण योगदान उत्पादन प्रणालियों में व्यावहारिक एलएलएम तैनाती का इसका प्रदर्शन हो सकता है। जबकि बहुत सारा एलएलएम शोध बेंचमार्क प्रदर्शन पर केंद्रित है, ऑडियोबूस्ट दिखाता है कि वास्तविक दुनिया के अनुप्रयोगों में ये मॉडल ठोस व्यावसायिक मेट्रिक्स को कैसे चला सकते हैं। खोजपूर्ण क्वेरीज़ में +1.82% की वृद्धि से पता चलता है कि सिस्टम उपयोगकर्ता व्यवहार को अधिक खोज-उन्मुख खोज पैटर्न की ओर सफलतापूर्वक मोड़ता है, जिससे मौलिक कोल्ड-स्टार्ट चुनौती का समाधान होता है।

उपयोगकर्ता-विशिष्ट कारकों को क्वेरी जनरेशन में शामिल करके इस दृष्टिकोण को और बढ़ाया जा सकता है, ठीक उसी तरह जैसे आधुनिक रिकमेंडर सिस्टम व्यक्तिगत प्राथमिकताओं के आधार पर सामग्री को वैयक्तिकृत करते हैं [Ricci et al., 2011]। इसके अतिरिक्त, ऑडियो सामग्री विश्लेषण का एकीकरण क्वेरी जनरेशन के लिए एक और आयाम प्रदान कर सकता है, जो मेटाडेटा से आगे बढ़कर वास्तविक सामग्री समझ की ओर ले जाता है।

6. संदर्भ

  1. Zhu, J. Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired image-to-image translation using cycle-consistent adversarial networks. Proceedings of the IEEE international conference on computer vision.
  2. Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.
  3. Ricci, F., Rokach, L., & Shapira, B. (2011). Introduction to recommender systems handbook. Springer.
  4. Palumbo, E., et al. (2025). AudioBoost: Increasing Audiobook Retrievability in Spotify Search with Synthetic Query Generation. EARL Workshop@RecSys.

उद्योग विश्लेषक परिप्रेक्ष्य

सीधी बात: ऑडियोबूस्ट केवल एक और एआई प्रयोग नहीं है - यह कोल्ड-स्टार्ट समस्या के खिलाफ एक सटीक हमला है जो दशकों से सामग्री प्लेटफार्मों को परेशान कर रही है। स्पॉटिफाई एलएमएम का उपयोग चैटबॉट्स के रूप में नहीं, बल्कि उपयोगकर्ता व्यवहार और सामग्री खोज की अर्थव्यवस्था को पुनर्आकार देने के लिए रणनीतिक हथियारों के रूप में कर रहा है।

कारण-प्रभाव श्रृंखला: कारण-प्रभाव श्रृंखला शानदार ढंग से इंजीनियर की गई है: सीमित ऑडियोबुक इंटरैक्शन → सिंथेटिक क्वेरी जनरेशन → बेहतर क्यूएसी सुझाव → उपयोगकर्ता व्यवहार संशोधन → बढ़ी हुई खोजपूर्ण क्वेरी → बेहतर ऑडियोबुक पुनर्प्राप्ति → व्यावसायिक मेट्रिक सुधार। यह एक आत्म-पुष्ट खोज लूप बनाता है जो मौलिक रूप से सामग्री एक्सपोजर के परिदृश्य को बदल देता है।

मुख्य बिंदु और कमियाँ: सबसे उल्लेखनीय नवाचार क्वेरी सुझाव और पुनर्प्राप्ति प्रणालियों दोनों में दोहरी तैनाती है - अधिकांश कंपनियाँ एक या दूसरे पर ही रुक जातीं। खोजपूर्ण क्वेरीज़ में 1.82% की वृद्धि वास्तविक व्यवहार परिवर्तन को दर्शाती है, न कि केवल एल्गोरिदम अनुकूलन को। हालाँकि, इस दृष्टिकोण में वास्तविक उपयोगकर्ता इरादे से अलग एक कृत्रिम क्वेरी पारिस्थितिकी तंत्र बनाने का जोखिम है, और पेपर समय के साथ संभावित क्वेरी गुणवत्ता गिरावट को संबोधित नहीं करता है।

कार्रवाई के निहितार्थ: उत्पाद नेताओं के लिए: यह दर्शाता है कि एलएलएम अनुप्रयोगों को पॉइंट सॉल्यूशंस के बजाय पारिस्थितिकी तंत्र-स्तरीय हस्तक्षेपों पर ध्यान केंद्रित करना चाहिए। इंजीनियरों के लिए: वास्तविक सबक शैक्षणिक तकनीकों को प्रोडक्शनाइज़ करने में है - ध्यान दें कि कैसे उन्होंने नए मूल्यांकन ढांचे का पीछा करने के बजाय स्थापित मेट्रिक्स का उपयोग किया। अगला सीमांत इन सिंथेटिक क्वेरीज़ को वैयक्तिकृत करते हुए खोज विविधता को बनाए रखना होगा।