-
#1ऑडियो-नॉवेल - तकनीकी दस्तावेज़ीकरण और संसाधनऑडियो-नॉवेल प्रौद्योगिकी और अनुप्रयोगों के बारे में व्यापक तकनीकी दस्तावेज़ीकरण और संसाधन।
-
#2प्राकृतिक भाषा क्वेरीज़ के साथ क्रॉस-मोडल ऑडियो रिट्रीवलमुक्त-रूप प्राकृतिक भाषा क्वेरीज़ का उपयोग करके ऑडियो रिट्रीवल पर शोध, जो क्रॉस-मोडल ऑडियो रिट्रीवल के लिए नए बेंचमार्क और बेसलाइन प्रस्तुत करता है।
-
#3ऑडियोबूस्ट: एलएलएम-जनित सिंथेटिक क्वेरीज़ के माध्यम से स्पॉटिफाई खोज में ऑडियोबुक खोज को बढ़ानास्पॉटिफाई की खोज प्रणाली में ऑडियोबुक पुनर्प्राप्ति में सुधार के लिए बड़ी भाषा मॉडल का उपयोग करके सिंथेटिक क्वेरी उत्पन्न करने पर शोध, जो क्वेरी ऑटो-पूर्णता और पुनर्प्राप्ति वृद्धि के माध्यम से कोल्ड-स्टार्ट चुनौतियों का समाधान करता है।
-
#4ऑडियोबुक-सीसी: नियंत्रणीय लंबे-संदर्भ बहु-कास्ट ऑडियोबुक निर्माण हेतु एक रूपरेखाऑडियोबुक-सीसी का विश्लेषण, एक नवीन वाक् संश्लेषण रूपरेखा जो सूक्ष्म नियंत्रण और लंबे-संदर्भ मॉडलिंग के साथ सुसंगत, भावनात्मक रूप से अभिव्यंजक बहु-कास्ट ऑडियोबुक उत्पन्न करती है।
-
#5ऑडियोबुक-सीसी: सूक्ष्म-नियंत्रण योग्य लंबे-संदर्भ बहु-प्रसारण ऑडियोबुक निर्माण हेतु एक रूपरेखाऑडियोबुक-सीसी का विश्लेषण, एक नवीन टीटीएस रूपरेखा जो सुसंगत, भावनात्मक रूप से अभिव्यंजक और संदर्भगत रूप से सुसंगत बहु-प्रसारण ऑडियोबुक्स का सूक्ष्म-नियंत्रण के साथ निर्माण करती है।
-
#6स्पॉटिफ़ाई में ग्राफ़ न्यूरल नेटवर्क के माध्यम से व्यक्तिगत ऑडियोबुक सिफ़ारिशेंस्पॉटिफ़ाई का अभिनव 2T-HGNN सिस्टम जो स्केलेबल ऑडियोबुक सिफ़ारिशों के लिए हेटरोजीनियस ग्राफ़ न्यूरल नेटवर्क और टू टावर मॉडल को जोड़ता है, जिससे 46% स्टार्ट रेट में वृद्धि हुई।
-
#7संगीत और गीतों का बोले गए शब्दों की पहचान पर प्रभाव: विश्लेषण और निहितार्थपृष्ठभूमि संगीत (गीतों के साथ और बिना) बोले गए शब्दों की पहचान को कैसे प्रभावित करता है, इसका विश्लेषण। सामाजिक वातावरण और भविष्य के कार्यों के लिए निहितार्थ।
-
#8कार्टून वीडियो के लिए कथन निर्माण: कार्य औपचारिकीकरण, डेटासेट और मॉडलयह शोधपत्र वीडियो के लिए कथन निर्माण के नवीन कार्य का परिचय देता है, पेप्पा पिग से एक डेटासेट प्रस्तुत करता है, और समयनिर्धारण एवं सामग्री निर्माण के लिए मॉडल प्रस्तावित करता है।
-
#9गैर-देशी बोली गई शब्द प्रसंस्करण का एक ध्वन्यात्मक मॉडल: विश्लेषण एवं अंतर्दृष्टियाँगैर-देशी शब्द प्रसंस्करण में ध्वन्यात्मक धारणा की भूमिका की जाँच करने वाले एक कम्प्यूटेशनल मॉडल का विश्लेषण, जो पारंपरिक स्वनिम संबंधी स्पष्टीकरणों को चुनौती देता है।
-
#10ध्वन्यात्मक और अर्थगत सन्निहितता: बोले गए शब्दों के एम्बेडिंग और मौखिक सामग्री पुनर्प्राप्ति में अनुप्रयोगबोले गए शब्दों के लिए ध्वन्यात्मक और अर्थगत जानकारी दोनों को समाहित करने वाला एक दो-चरणीय ढांचा, जो साधारण शब्द मिलान से परे उन्नत मौखिक दस्तावेज़ पुनर्प्राप्ति को सक्षम बनाता है।
-
#11ऑडियो वर्णन द्वारा निर्देशित दुर्बल-पर्यवेक्षित क्रिया पहचानएक शोध पत्र जो शोरगुल वाले ऑडियो वर्णन को दुर्बल पर्यवेक्षण के रूप में उपयोग करके वीडियो क्रिया पहचान मॉडल को प्रशिक्षित करने, एनोटेशन लागत कम करते हुए बहु-मोडल सुविधाओं का लाभ उठाने की खोज करता है।
अंतिम अपडेट: 2026-01-12 05:31:33