-
#1رواية القصص التعاونية مع الممثلين البشريين والراويات الذكاء الاصطناعي: تحليل لتقرير حدثتحليل لاستخدام GPT-3 كراوٍ مشارك في مسرح الارتجال الحي. يغطي المنهجية، وتغذية راجعة من الجمهور والمؤدين، وتداعيات التعاون الإبداعي بين الإنسان والذكاء الاصطناعي.
-
#2استرجاع الصوت عبر الوسائط باستخدام استعلامات اللغة الطبيعيةبحث في استرجاع الصوت باستخدام استعلامات اللغة الطبيعية الحرة، يقدم معايير تقييم جديدة وأسساً مقارنة لاسترجاع الصوت عبر الوسائط.
-
#3AudioBoost: تعزيز اكتشاف الكتب الصوتية في بحث Spotify عبر استعلامات اصطناعية مولّدة بواسطة نماذج اللغة الكبيرةتحليل نظام AudioBoost الذي يستخدم نماذج اللغة الكبيرة لتوليد استعلامات اصطناعية من بيانات وصفية للكتب الصوتية لتحسين الاسترجاع والاقتراحات في سيناريو البدء البارد لـ Spotify.
-
#4Audiobook-CC: إطار عمل لتوليد الكتب الصوتية متعددة الشخصيات ذات السياق الطويل والقابل للتحكمتحليل لإطار عمل Audiobook-CC، وهو إطار جديد لتوليد الكلام يهدف لإنشاء كتب صوتية متعددة الشخصيات متماسكة ومعبرة عاطفياً، مع تحكم دقيق ونمذجة للسياق الطويل.
-
#5Audiobook-CC: إطار عمل لتوليد الكتب الصوتية متعددة الشخصيات ذات السياق الطويل والخاضعة للتحكم الدقيقتحليل إطار Audiobook-CC الجديد لتوليد الكتب الصوتية متعددة الشخصيات المتماسكة والمعبرة عاطفياً والمتسقة سياقياً مع تحكم دقيق.
-
#6توصيات الكتب الصوتية المخصصة في سبوتيفاي من خلال الشبكات العصبية البيانيةنظام 2T-HGNN المبتكر من سبوتيفاي الذي يجمع بين الشبكات العصبية البيانية غير المتجانسة ونماذج البرج المزدوج لتوصيات الكتب الصوتية القابلة للتوسع، محققاً زيادة +46% في معدل البدء.
-
#7MAMLCon: التعلم الفوقي للتصنيف المستمر للكلمات المنطوقة باستخدام عدد قليل من الأمثلةنهج تعلم فوقي جديد (MAMLCon) يخفف من النسيان الكارثي في التعلم المستمر باستخدام عدد قليل من الأمثلة لتصنيف الكلمات المنطوقة، متفوقًا على الطرق الحالية مثل OML.
-
#8الكتب الصوتية المتنقلة لفهم الاستماع في اللغة الإنجليزية كلغة أجنبية: إطار عمل لطلاب الجامعةتحليل لدمج الكتب الصوتية المتنقلة لتطوير مهارات الفهم الاستماعي لدى طلاب الجامعة الدارسين للغة الإنجليزية كلغة أجنبية، متضمنًا المزايا، ومعايير الاختيار، ومراحل التدريس، والتقييم.
-
#9Movie101v2: معيار محسّن لتوليد السرد السينمائي التلقائيتحليل لمجموعة البيانات ثنائية اللغة واسعة النطاق Movie101v2 لتوليد سرد الأفلام، بما في ذلك خارطة طريق المهام ذات المراحل الثلاث، والتقييمات الأساسية، واتجاهات البحث المستقبلية.
-
#10تأثير الموسيقى والكلمات على تمييز الكلام المنطوق: التحليل والتداعياتتحليل بحثي حول تأثير الموسيقى الخلفية مع الكلمات وبدونها على تمييز الكلام المنطوق، مع استنتاجات للمواقع الاجتماعية وأعمال مستقبلية.
-
#11WonderFlow: تصميم مقاطع الفيديو المتحركة للبيانات مع التركيز على السردأداة تأليف تفاعلية تُبسط إنشاء مقاطع فيديو للبيانات المتحركة من خلال ربط السرد بتحريك الرسوم البيانية وتوفير تأثيرات حركية واعية للهيكل.
-
#12توليد السرد لمقاطع الفيديو الكرتونية: صياغة المهمة، مجموعة البيانات، والنماذجتقدم هذه الورقة البحثية مهمة جديدة لتوليد السرد لمقاطع الفيديو، وتعرض مجموعة بيانات من مسلسل
-
#13نموذج صوتي لمعالجة الكلمات المنطوقة لدى غير الناطقين الأصليين: تحليل واستنتاجاتتحليل لنموذج حاسوبي يستكشف دور الإدراك الصوتي في معالجة الكلمات لدى غير الناطقين الأصليين، متحدياً التفسيرات الصوتية التقليدية.
-
#14التضمين الصوتي والدلالي للكلمات المنطوقة مع تطبيقات في استرجاع المحتوى الصوتيإطار عمل من مرحلتين لتضمين الكلمات المنطوقة بمعلومات صوتية ودلالية، مما يتيح استرجاعاً متقدماً للمستندات الصوتية يتجاوز مجرد مطابقة المصطلحات البسيطة.
-
#15تحليل الإيقاع الصوتي للكتب الصوتية: نماذج معالجة اللغة الطبيعية لتحسين تحويل النص إلى كلامبحث في التنبؤ بخصائص الإيقاع الصوتي (النبرة، الصوت، السرعة) من النصوص السردية باستخدام نماذج معالجة اللغة الطبيعية، لتحسين جودة الكتب الصوتية المُولَّدة آليًا.
-
#16تصنيف الرواة غير الموثوقين باستخدام نماذج اللغة الكبيرةبحث في التعريف الحسابي للرواة غير الموثوقين باستخدام نماذج اللغة الكبيرة، يتضمن مجموعة بيانات TUN A وتصنيف عدم الموثوقية داخل السرد، وبين السرد، وبين النصوص.
-
#17الكشف عن الأفعال باستخدام الإشراف الضعيف الموجه بالتعليق الصوتيورقة بحثية تستكشف كيفية استخدام التعليق الصوتي المشوش كإشراف ضعيف لتدريب نماذج الكشف عن الأفعال في الفيديو، مما يقلل تكاليف التعليق التوضيحي مع الاستفادة من الميزات متعددة الوسائط.
-
#18MultiActor-Audiobook: توليد الكتب الصوتية بمتحدثين متعددين دون الحاجة للتدريب المسبقنهج مبتكر لتوليد كتب صوتية معبرة باستخدام شخصيات متعددة الوسائط وتعليمات نصية ذكية، يتجنب التكلفة العالية للتدريب والتعليقات التوضيحية اليدوية.
-
#19MultiActor-Audiobook: توليد الصوتيات متعددة الشخصيات من دون تدريب مسبق باستخدام الوجوه والأصواتتحليل تقني لنظام MultiActor-Audiobook، وهو نظام مبتكر لتوليد الكتب الصوتية المعبرة باستخدام شخصيات متعددة الوسائط وتعليمات نصية قائمة على نماذج اللغة الكبيرة، دون الحاجة إلى تدريب مسبق.
آخر تحديث: 2026-01-11 23:31:25