Audio-Novel: 20 فصلاً في الكتب الصوتية، الذكاء الاصطناعي، وتقنيات السرد المتطورة

اللغة

#1

رواية القصص التعاونية مع الممثلين البشريين والراويات الذكاء الاصطناعي: تحليل لتقرير حدث

تحليل لاستخدام GPT-3 كراوٍ مشارك في مسرح الارتجال الحي. يغطي المنهجية، وتغذية راجعة من الجمهور والمؤدين، وتداعيات التعاون الإبداعي بين الإنسان والذكاء الاصطناعي.
#2

تقييم النظرة العالمية لنماذج اللغة في توليد القصص الخيالية

تحليل قدرة نماذج اللغة الكبيرة على الحفاظ على عوالم خيالية متسقة، وكشف القيود في تماسك السرد والاحتفاظ بالحالة للكتابة الإبداعية.
#3

استرجاع الصوت عبر الوسائط باستخدام استعلامات اللغة الطبيعية

بحث في استرجاع الصوت باستخدام استعلامات اللغة الطبيعية الحرة، يقدم معايير تقييم جديدة وأسساً مقارنة لاسترجاع الصوت عبر الوسائط.
#4

تأطير تجربة الكتاب المسموع: إطار نظري

تحليل للإطار النظري لتأطير الاختلافات بين قراءة الكتب المطبوعة والاستماع إلى الكتب المسموعة، مع التركيز على ممارسات الاستماع المتنقلة.
#5

AudioBoost: تعزيز اكتشاف الكتب الصوتية في بحث Spotify عبر استعلامات اصطناعية مولّدة بواسطة نماذج اللغة الكبيرة

تحليل نظام AudioBoost الذي يستخدم نماذج اللغة الكبيرة لتوليد استعلامات اصطناعية من بيانات وصفية للكتب الصوتية لتحسين الاسترجاع والاقتراحات في سيناريو البدء البارد لـ Spotify.
#6

AudioBoost: تعزيز اكتشاف الكتب الصوتية في بحث Spotify عبر استعلامات اصطناعية مولّدة بواسطة نماذج اللغة الكبيرة

تحليل نظام AudioBoost الذي يستخدم نماذج اللغة الكبيرة لتوليد استعلامات اصطناعية لتحسين قابلية استرجاع الكتب الصوتية في محرك بحث Spotify في سيناريوهات البداية الباردة.
#7

Audiobook-CC: إطار عمل لتوليد الكتب الصوتية متعددة الشخصيات ذات السياق الطويل والقابل للتحكم

تحليل لإطار عمل Audiobook-CC، وهو إطار جديد لتوليد الكلام يهدف لإنشاء كتب صوتية متعددة الشخصيات متماسكة ومعبرة عاطفياً، مع تحكم دقيق ونمذجة للسياق الطويل.
#8

Audiobook-CC: إطار عمل لتوليد الكتب الصوتية متعددة الشخصيات ذات السياق الطويل والخاضعة للتحكم الدقيق

تحليل إطار Audiobook-CC الجديد لتوليد الكتب الصوتية متعددة الشخصيات المتماسكة والمعبرة عاطفياً والمتسقة سياقياً مع تحكم دقيق.
#9

تحليل 'الكتب الصوتية الرقمية: وسائط جديدة، مستخدمون، وتجارب' - منظور دراسات الإعلام

تحليل نقدي لمراجعة كتاب 'الكتب الصوتية الرقمية' يستكشف نظرية الوساطة الإعلامية، وما بعد الظاهراتية، والمشهد المتطور لاستهلاك الأدب القائم على الصوت.
#10

الترجمة الصوتية التلقائية الشاملة للكتب الصوتية: المجموعة النصية، النماذج والتحليل

تحليل نماذج الترجمة الشاملة من الكلام إلى النص على مجموعة كتب صوتية معززة، واستكشاف سيناريوهات التدريب وكفاءة النموذج.
#11

الموسيقى ومستويات السرد في السينما: تحليل سردي

تحليل معمق لموسيقى الأفلام من منظور السرديات، يستكشف كيفية عمل الموسيقى عبر مستويات السرد المختلفة في السينما.
#12

توصيات الكتب الصوتية المخصصة في سبوتيفاي من خلال الشبكات العصبية البيانية

نظام 2T-HGNN المبتكر من سبوتيفاي الذي يجمع بين الشبكات العصبية البيانية غير المتجانسة ونماذج البرج المزدوج لتوصيات الكتب الصوتية القابلة للتوسع، محققاً زيادة +46% في معدل البدء.
#13

J-MAC: مجموعة بيانات صوتية يابانية متعددة المتحدثين لتوليف الكلام

تحليل منهجية بناء مجموعة J-MAC، والإسهامات التقنية، ونتائج التقييم، والاتجاهات المستقبلية لتوليف الكلام التعبيري للكتب الصوتية.
#14

MAMLCon: التعلم الفوقي للتصنيف المستمر للكلمات المنطوقة باستخدام عدد قليل من الأمثلة

نهج تعلم فوقي جديد (MAMLCon) يخفف من النسيان الكارثي في التعلم المستمر باستخدام عدد قليل من الأمثلة لتصنيف الكلمات المنطوقة، متفوقًا على الطرق الحالية مثل OML.
#15

الكتب الصوتية المتنقلة لفهم الاستماع في اللغة الإنجليزية كلفة أجنبية: إطار عمل لطلاب الجامعة

تحليل وإطار عمل لدمج الكتب الصوتية المتنقلة (MABs) لتطوير مهارات الفهم الاستماعي لدى طلاب الجامعة الدارسين للغة الإنجليزية كلفة أجنبية، يشمل المزايا، الاختيار، التنفيذ، والتقييم.
#16

الكتب الصوتية المتنقلة لفهم الاستماع في اللغة الإنجليزية كلفة أجنبية: إطار عمل لطلاب الجامعة

تحليل وإطار عمل لدمج الكتب الصوتية المتنقلة لتطوير مهارات الفهم الاستماعي لدى طلاب الجامعة الدارسين للغة الإنجليزية كلفة أجنبية، يشمل المزايا والاختيار والتطبيق والتقييم.
#17

Movie101v2: معيار محسّن لتوليد السرد السينمائي التلقائي

تحليل لمجموعة البيانات ثنائية اللغة واسعة النطاق Movie101v2 لتوليد سرد الأفلام، بما في ذلك خارطة طريق المهام ذات المراحل الثلاث، والتقييمات الأساسية، واتجاهات البحث المستقبلية.
#18

تأثير الموسيقى والكلمات على تمييز الكلام المنطوق: التحليل والتداعيات

تحليل بحثي حول تأثير الموسيقى الخلفية مع الكلمات وبدونها على تمييز الكلام المنطوق، مع استنتاجات للمواقع الاجتماعية وأعمال مستقبلية.
#19

WonderFlow: تصميم مقاطع الفيديو المتحركة للبيانات مع التركيز على السرد

أداة تأليف تفاعلية تُبسط إنشاء مقاطع فيديو للبيانات المتحركة من خلال ربط السرد بتحريك الرسوم البيانية وتوفير تأثيرات حركية واعية للهيكل.
#20

توليد السرد التلقائي لمقاطع الفيديو الكرتونية: صياغة المهمة، مجموعة البيانات، والنماذج

ورقة بحثية تقدم مهمة توليد السرد التلقائي لمقاطع الفيديو، وتعرض مجموعة بيانات جديدة من مسلسل
#21

نموذج صوتي لمعالجة الكلمات المنطوقة لدى غير الناطقين الأصليين: تحليل واستنتاجات

تحليل لنموذج حاسوبي يستكشف دور الإدراك الصوتي في معالجة الكلمات لدى غير الناطقين الأصليين، متحدياً التفسيرات الصوتية التقليدية.
#22

التضمين الصوتي والدلالي للكلمات المنطوقة مع تطبيقات في استرجاع المحتوى الصوتي

إطار عمل من مرحلتين لتضمين الكلمات المنطوقة بمعلومات صوتية ودلالية، مما يتيح استرجاعاً متقدماً للمستندات الصوتية يتجاوز مجرد مطابقة المصطلحات البسيطة.
#23

تحليل الإيقاع الصوتي للكتب الصوتية: نماذج معالجة اللغة الطبيعية لتحسين تحويل النص إلى كلام

بحث في التنبؤ بخصائص الإيقاع الصوتي (النبرة، الصوت، السرعة) من النصوص السردية باستخدام نماذج معالجة اللغة الطبيعية، لتحسين جودة الكتب الصوتية المُولَّدة آليًا.
#24

تصنيف الرواة غير الموثوقين باستخدام نماذج اللغة الكبيرة

بحث في التعريف الحسابي للرواة غير الموثوقين باستخدام نماذج اللغة الكبيرة، يتضمن مجموعة بيانات TUN A وتصنيف عدم الموثوقية داخل السرد، وبين السرد، وبين النصوص.
#25

الكشف عن الأفعال باستخدام الإشراف الضعيف الموجه بالرواية الصوتية

ورقة بحثية تستكشف كيفية استخدام الرواية الصوتية المشوشة كإشراف ضعيف لتدريب نماذج الكشف عن الأفعال، مما يقلل تكاليف التعليق التوضيحي مع الاستفادة من ميزات الفيديو متعددة الوسائط.
#26

MultiActor-Audiobook: توليد الكتب الصوتية بمتحدثين متعددين دون الحاجة للتدريب المسبق

نهج مبتكر لتوليد كتب صوتية معبرة باستخدام شخصيات متعددة الوسائط وتعليمات نصية ذكية، يتجنب التكلفة العالية للتدريب والتعليقات التوضيحية اليدوية.
#27

MultiActor-Audiobook: توليد الصوتيات متعددة الشخصيات من دون تدريب مسبق باستخدام الوجوه والأصوات

تحليل تقني لنظام MultiActor-Audiobook، وهو نظام مبتكر لتوليد الكتب الصوتية المعبرة باستخدام شخصيات متعددة الوسائط وتعليمات نصية قائمة على نماذج اللغة الكبيرة، دون الحاجة إلى تدريب مسبق.

آخر تحديث: 2026-02-25 12:01:13