-
#1داستانسرایی مشارکتی با بازیگران انسانی و راویان هوش مصنوعی: تحلیل گزارش یک رویدادتحلیل استفاده از GPT-3 به عنوان راوی همکار در تئاتر بداهه زنده. شامل روششناسی، بازخورد مخاطب/بازیگر و پیامدهای آن برای همکاری خلاق انسان و هوش مصنوعی.
-
#2ارزیابی جهاننگری مدلهای زبانی برای تولید داستانتحلیل توانایی مدلهای زبانی بزرگ در حفظ جهانهای داستانی سازگار، آشکارکننده محدودیتها در انسجام روایی و نگهداری حالت برای نوشتن خلاق.
-
#3audio-novel - مستندات فنی و منابعمستندات فنی جامع و منابع مربوط به فناوری و کاربردهای audio-novel.
-
#4بازیابی صوتی بینحالتی با پرسوجوهای زبان طبیعیتحقیق در مورد بازیابی صوت با استفاده از پرسوجوهای زبان طبیعی آزاد، معرفی معیارها و خطوط پایه جدید برای بازیابی صوتی بینحالتی
-
#5مفهومسازی تجربه کتاب صوتی: چارچوب نظریتحلیل چارچوب نظری برای مفهومسازی تفاوتهای بین خواندن کتاب چاپی و گوش دادن به کتاب صوتی، با تأکید بر شیوههای گوش دادن سیار.
-
#6AudioBoost: بهبود کشف کتابهای صوتی در جستجوی اسپاتیفای از طریق پرسوجوهای مصنوعی تولیدشده توسط مدلهای زبانی بزرگتحلیل سیستم AudioBoost که از مدلهای زبانی بزرگ برای تولید پرسوجوهای مصنوعی از فرادادههای کتابهای صوتی، به منظور بهبود بازیابی و پیشنهادات جستجو در سناریوی شروع سرد اسپاتیفای استفاده میکند.
-
#7AudioBoost: بهبود کشف کتابهای صوتی در جستجوی اسپاتیفای از طریق پرسوجوهای مصنوعی تولیدشده توسط مدلهای زبانی بزرگتحلیل سیستم AudioBoost که از مدلهای زبانی بزرگ برای تولید پرسوجوهای مصنوعی به منظور بهبود بازیابی کتابهای صوتی در موتور جستجوی اسپاتیفای در شرایط شروع سرد استفاده میکند.
-
#8Audiobook-CC: یک چارچوب برای تولید کنترلشدهی کتابهای صوتی چندصدایی با زمینهی طولانیتحلیل Audiobook-CC، یک چارچوب نوین ترکیب گفتار برای تولید کتابهای صوتی چندصدایی منسجم و دارای بیان عاطفی با کنترل دقیق و مدلسازی زمینهی طولانی.
-
#9Audiobook-CC: یک چارچوب برای تولید کنترلپذیر کتابهای صوتی چندگانه با زمینهی طولانیتحلیل Audiobook-CC، یک چارچوب TTS نوآورانه برای تولید کتابهای صوتی چندگانه منسجم، دارای بیان احساسی و سازگار با زمینه، همراه با کنترل دقیق.
-
#10تحلیل کتاب 'کتابهای صوتی دیجیتال: رسانههای جدید، کاربران و تجربیات' - از منظر مطالعات رسانهتحلیلی انتقادی از نقد کتاب 'کتابهای صوتی دیجیتال' که نظریه رسانهای شدن، پدیدارشناسی پسین و چشمانداز در حال تحول مصرف ادبیات مبتنی بر صوت را بررسی میکند.
-
#11ترجمه گفتار به متن سرتاسری کتابهای صوتی: پیکره، مدلها و تحلیلتحلیل مدلهای ترجمه گفتار به متن سرتاسری روی یک پیکره کتاب صوتی تقویتشده، بررسی سناریوهای آموزش و کارایی مدل.
-
#12توصیههای شخصیسازیشده کتابهای صوتی در اسپاتیفای از طریق شبکههای عصبی گرافسیستم نوآورانه 2T-HGNN اسپاتیفای که شبکههای عصبی گراف ناهمگن و مدلهای دو برجی را برای توصیههای مقیاسپذیر کتاب صوتی ترکیب میکند و 46٪ افزایش نرخ شروع را محقق کرده است.
-
#13J-MAC: پیکرهی صوتی چندگویندهی ژاپنی برای کتابهای صوتی در سنتز گفتارتحلیل روششناسی ساخت پیکرهی J-MAC، مشارکتهای فنی، نتایج ارزیابی و مسیرهای آینده برای سنتز گفتار بیانی در کتابهای صوتی.
-
#14MAMLCon: فراآموزش برای طبقهبندی کلمات گفتاری پیوسته با نمونههای کمیک رویکرد نوین فراآموزش (MAMLCon) که فراموشی فاجعهبار در یادگیری پیوسته با نمونههای کم برای طبقهبندی کلمات گفتاری را کاهش میدهد و از روشهای موجود مانند OML عملکرد بهتری دارد.
-
#15کتابهای صوتی موبایلی برای درک شنیداری زبان انگلیسی به عنوان زبان خارجی: چارچوبی برای دانشجویان دانشگاهتحلیل و چارچوبی برای ادغام کتابهای صوتی موبایلی (MABs) جهت توسعه مهارتهای درک شنیداری در دانشجویان دانشگاهی زبان انگلیسی به عنوان زبان خارجی، شامل مزایا، انتخاب، اجرا و ارزیابی.
-
#16کتابهای صوتی موبایلی برای درک شنیداری زبان انگلیسی به عنوان زبان خارجی: چارچوبی برای دانشجویان دانشگاهتحلیل و چارچوبی برای ادغام کتابهای صوتی موبایلی به منظور توسعه مهارتهای درک شنیداری در دانشجویان دانشگاهی زبان انگلیسی به عنوان زبان خارجی، شامل مزایا، انتخاب، اجرا و ارزیابی.
-
#17Movie101v2: یک معیار بهبودیافته برای تولید خودکار روایت فیلمتحلیل Movie101v2، یک مجموعه داده دوزبانه بزرگ برای روایت فیلم، شامل نقشه راه سه مرحلهای، ارزیابیهای پایه و جهتهای تحقیقاتی آینده.
-
#18تأثیر موسیقی و کلام بر تشخیص کلام گفتاری: تحلیل و پیامدهاتحقیقی در مورد چگونگی تأثیر موسیقی پسزمینه با و بدون کلام بر تشخیص کلمات گفتاری، با پیامدهایی برای محیطهای اجتماعی و کارهای آینده.
-
#19واندرفلو: طراحی ویدئوهای دادهای متحرک با محوریت روایتیک ابزار نویسندگی تعاملی که با پیوند دادن روایت به انیمیشنهای نمودار و ارائه جلوههای متحرک ساختارآگاه، ایجاد ویدئوهای دادهای متحرک را ساده میکند.
-
#20تولید روایت برای انیمیشنهای کارتونی: صورتبندی وظیفه، مجموعهداده و مدلهامقالهای پژوهشی که وظیفه تولید خودکار روایت برای ویدیو را معرفی کرده، مجموعهدادهای جدید از پپا پیگ ارائه میدهد و مدلهایی برای زمانبندی و تولید محتوا پیشنهاد میکند.
-
#21یک مدل آوایی برای پردازش کلمات گفتاری غیربومی: تحلیل و بینشهاتحلیل یک مدل محاسباتی که نقش ادراک آوایی را در پردازش کلمات غیربومی بررسی میکند و توضیحات سنتی واجشناختی را به چالش میکشد.
-
#22تعبیه آوایی و معنایی واژگان گفتاری با کاربرد در بازیابی محتوای گفتاریچارچوبی دو مرحلهای برای تعبیه واژگان گفتاری با اطلاعات آوایی و معنایی، که امکان بازیابی پیشرفته اسناد گفتاری فراتر از تطبیق ساده اصطلاحات را فراهم میکند.
-
#23تحلیل آهنگ گفتار کتابهای صوتی: مدلهای پردازش زبان طبیعی برای بهبود متن-به-گفتارپژوهشی در زمینه پیشبینی ویژگیهای آهنگ گفتار (زیروبمی، بلندی، سرعت) از متن روایی با استفاده از پردازش زبان طبیعی و مدلهای زبانی، به منظور بهبود تولید کتابهای صوتی.
-
#24تشخیص عمل با نظارت ضعیف هدایتشده توسط روایت صوتیمقالهای پژوهشی که چگونگی استفاده از روایت صوتی نویزی به عنوان نظارت ضعیف برای آموزش مدلهای تشخیص عمل را بررسی میکند و هزینه حاشیهنویسی را کاهش میدهد.
-
#25MultiActor-Audiobook: تولید کتابهای صوتی با چندین گوینده به صورت Zero-Shotروشی zero-shot برای تولید کتابهای صوتی بیان با استفاده از پرسوناهای چندوجهی گوینده و دستورات مبتنی بر LLM، حذف نیاز به آموزش پرهزینه و حاشیهنویسی دستی
-
#26MultiActor-Audiobook: تولید صوتی کتاب با چهرهها و صداها به صورت Zero-Shotتحلیل فنی MultiActor-Audiobook، یک سیستم نوین Zero-Shot برای تولید کتابهای صوتی بیانی با استفاده از پرسوناهای چندوجهی گوینده و دستورالعملهای مبتنی بر LLM.
آخرین بروزرسانی: 2026-02-25 12:01:14