-
#1رواية القصص التعاونية مع الممثلين البشريين والراويات الذكاء الاصطناعي: تحليل لتقرير حدثتحليل لاستخدام GPT-3 كراوٍ مشارك في مسرح الارتجال الحي. يغطي المنهجية، وتغذية راجعة من الجمهور والمؤدين، وتداعيات التعاون الإبداعي بين الإنسان والذكاء الاصطناعي.
-
#2تقييم النظرة العالمية لنماذج اللغة في توليد القصص الخياليةتحليل قدرة نماذج اللغة الكبيرة على الحفاظ على عوالم خيالية متسقة، وكشف القيود في تماسك السرد والاحتفاظ بالحالة للكتابة الإبداعية.
-
#3استرجاع الصوت عبر الوسائط باستخدام استعلامات اللغة الطبيعيةبحث في استرجاع الصوت باستخدام استعلامات اللغة الطبيعية الحرة، يقدم معايير تقييم جديدة وأسساً مقارنة لاسترجاع الصوت عبر الوسائط.
-
#4تأطير تجربة الكتاب المسموع: إطار نظريتحليل للإطار النظري لتأطير الاختلافات بين قراءة الكتب المطبوعة والاستماع إلى الكتب المسموعة، مع التركيز على ممارسات الاستماع المتنقلة.
-
#5AudioBoost: تعزيز اكتشاف الكتب الصوتية في بحث Spotify عبر استعلامات اصطناعية مولّدة بواسطة نماذج اللغة الكبيرةتحليل نظام AudioBoost الذي يستخدم نماذج اللغة الكبيرة لتوليد استعلامات اصطناعية من بيانات وصفية للكتب الصوتية لتحسين الاسترجاع والاقتراحات في سيناريو البدء البارد لـ Spotify.
-
#6AudioBoost: تعزيز اكتشاف الكتب الصوتية في بحث Spotify عبر استعلامات اصطناعية مولّدة بواسطة نماذج اللغة الكبيرةتحليل نظام AudioBoost الذي يستخدم نماذج اللغة الكبيرة لتوليد استعلامات اصطناعية لتحسين قابلية استرجاع الكتب الصوتية في محرك بحث Spotify في سيناريوهات البداية الباردة.
-
#7Audiobook-CC: إطار عمل لتوليد الكتب الصوتية متعددة الشخصيات ذات السياق الطويل والقابل للتحكمتحليل لإطار عمل Audiobook-CC، وهو إطار جديد لتوليد الكلام يهدف لإنشاء كتب صوتية متعددة الشخصيات متماسكة ومعبرة عاطفياً، مع تحكم دقيق ونمذجة للسياق الطويل.
-
#8Audiobook-CC: إطار عمل لتوليد الكتب الصوتية متعددة الشخصيات ذات السياق الطويل والخاضعة للتحكم الدقيقتحليل إطار Audiobook-CC الجديد لتوليد الكتب الصوتية متعددة الشخصيات المتماسكة والمعبرة عاطفياً والمتسقة سياقياً مع تحكم دقيق.
-
#9تحليل 'الكتب الصوتية الرقمية: وسائط جديدة، مستخدمون، وتجارب' - منظور دراسات الإعلامتحليل نقدي لمراجعة كتاب 'الكتب الصوتية الرقمية' يستكشف نظرية الوساطة الإعلامية، وما بعد الظاهراتية، والمشهد المتطور لاستهلاك الأدب القائم على الصوت.
-
#10الترجمة الصوتية التلقائية الشاملة للكتب الصوتية: المجموعة النصية، النماذج والتحليلتحليل نماذج الترجمة الشاملة من الكلام إلى النص على مجموعة كتب صوتية معززة، واستكشاف سيناريوهات التدريب وكفاءة النموذج.
-
#11الموسيقى ومستويات السرد في السينما: تحليل سرديتحليل معمق لموسيقى الأفلام من منظور السرديات، يستكشف كيفية عمل الموسيقى عبر مستويات السرد المختلفة في السينما.
-
#12توصيات الكتب الصوتية المخصصة في سبوتيفاي من خلال الشبكات العصبية البيانيةنظام 2T-HGNN المبتكر من سبوتيفاي الذي يجمع بين الشبكات العصبية البيانية غير المتجانسة ونماذج البرج المزدوج لتوصيات الكتب الصوتية القابلة للتوسع، محققاً زيادة +46% في معدل البدء.
-
#13J-MAC: مجموعة بيانات صوتية يابانية متعددة المتحدثين لتوليف الكلامتحليل منهجية بناء مجموعة J-MAC، والإسهامات التقنية، ونتائج التقييم، والاتجاهات المستقبلية لتوليف الكلام التعبيري للكتب الصوتية.
-
#14MAMLCon: التعلم الفوقي للتصنيف المستمر للكلمات المنطوقة باستخدام عدد قليل من الأمثلةنهج تعلم فوقي جديد (MAMLCon) يخفف من النسيان الكارثي في التعلم المستمر باستخدام عدد قليل من الأمثلة لتصنيف الكلمات المنطوقة، متفوقًا على الطرق الحالية مثل OML.
-
#15الكتب الصوتية المتنقلة لفهم الاستماع في اللغة الإنجليزية كلفة أجنبية: إطار عمل لطلاب الجامعةتحليل وإطار عمل لدمج الكتب الصوتية المتنقلة (MABs) لتطوير مهارات الفهم الاستماعي لدى طلاب الجامعة الدارسين للغة الإنجليزية كلفة أجنبية، يشمل المزايا، الاختيار، التنفيذ، والتقييم.
-
#16الكتب الصوتية المتنقلة لفهم الاستماع في اللغة الإنجليزية كلفة أجنبية: إطار عمل لطلاب الجامعةتحليل وإطار عمل لدمج الكتب الصوتية المتنقلة لتطوير مهارات الفهم الاستماعي لدى طلاب الجامعة الدارسين للغة الإنجليزية كلفة أجنبية، يشمل المزايا والاختيار والتطبيق والتقييم.
-
#17Movie101v2: معيار محسّن لتوليد السرد السينمائي التلقائيتحليل لمجموعة البيانات ثنائية اللغة واسعة النطاق Movie101v2 لتوليد سرد الأفلام، بما في ذلك خارطة طريق المهام ذات المراحل الثلاث، والتقييمات الأساسية، واتجاهات البحث المستقبلية.
-
#18تأثير الموسيقى والكلمات على تمييز الكلام المنطوق: التحليل والتداعياتتحليل بحثي حول تأثير الموسيقى الخلفية مع الكلمات وبدونها على تمييز الكلام المنطوق، مع استنتاجات للمواقع الاجتماعية وأعمال مستقبلية.
-
#19WonderFlow: تصميم مقاطع الفيديو المتحركة للبيانات مع التركيز على السردأداة تأليف تفاعلية تُبسط إنشاء مقاطع فيديو للبيانات المتحركة من خلال ربط السرد بتحريك الرسوم البيانية وتوفير تأثيرات حركية واعية للهيكل.
-
#20توليد السرد التلقائي لمقاطع الفيديو الكرتونية: صياغة المهمة، مجموعة البيانات، والنماذجورقة بحثية تقدم مهمة توليد السرد التلقائي لمقاطع الفيديو، وتعرض مجموعة بيانات جديدة من مسلسل
-
#21نموذج صوتي لمعالجة الكلمات المنطوقة لدى غير الناطقين الأصليين: تحليل واستنتاجاتتحليل لنموذج حاسوبي يستكشف دور الإدراك الصوتي في معالجة الكلمات لدى غير الناطقين الأصليين، متحدياً التفسيرات الصوتية التقليدية.
-
#22التضمين الصوتي والدلالي للكلمات المنطوقة مع تطبيقات في استرجاع المحتوى الصوتيإطار عمل من مرحلتين لتضمين الكلمات المنطوقة بمعلومات صوتية ودلالية، مما يتيح استرجاعاً متقدماً للمستندات الصوتية يتجاوز مجرد مطابقة المصطلحات البسيطة.
-
#23تحليل الإيقاع الصوتي للكتب الصوتية: نماذج معالجة اللغة الطبيعية لتحسين تحويل النص إلى كلامبحث في التنبؤ بخصائص الإيقاع الصوتي (النبرة، الصوت، السرعة) من النصوص السردية باستخدام نماذج معالجة اللغة الطبيعية، لتحسين جودة الكتب الصوتية المُولَّدة آليًا.
-
#24تصنيف الرواة غير الموثوقين باستخدام نماذج اللغة الكبيرةبحث في التعريف الحسابي للرواة غير الموثوقين باستخدام نماذج اللغة الكبيرة، يتضمن مجموعة بيانات TUN A وتصنيف عدم الموثوقية داخل السرد، وبين السرد، وبين النصوص.
-
#25الكشف عن الأفعال باستخدام الإشراف الضعيف الموجه بالرواية الصوتيةورقة بحثية تستكشف كيفية استخدام الرواية الصوتية المشوشة كإشراف ضعيف لتدريب نماذج الكشف عن الأفعال، مما يقلل تكاليف التعليق التوضيحي مع الاستفادة من ميزات الفيديو متعددة الوسائط.
-
#26MultiActor-Audiobook: توليد الكتب الصوتية بمتحدثين متعددين دون الحاجة للتدريب المسبقنهج مبتكر لتوليد كتب صوتية معبرة باستخدام شخصيات متعددة الوسائط وتعليمات نصية ذكية، يتجنب التكلفة العالية للتدريب والتعليقات التوضيحية اليدوية.
-
#27MultiActor-Audiobook: توليد الصوتيات متعددة الشخصيات من دون تدريب مسبق باستخدام الوجوه والأصواتتحليل تقني لنظام MultiActor-Audiobook، وهو نظام مبتكر لتوليد الكتب الصوتية المعبرة باستخدام شخصيات متعددة الوسائط وتعليمات نصية قائمة على نماذج اللغة الكبيرة، دون الحاجة إلى تدريب مسبق.
آخر تحديث: 2026-02-25 12:01:13