-
#1داستانسرایی مشارکتی با بازیگران انسانی و راویان هوش مصنوعی: تحلیل گزارش یک رویدادتحلیل استفاده از GPT-3 به عنوان راوی همکار در تئاتر بداهه زنده. شامل روششناسی، بازخورد مخاطب/بازیگر و پیامدهای آن برای همکاری خلاق انسان و هوش مصنوعی.
-
#2audio-novel - مستندات فنی و منابعمستندات فنی جامع و منابع مربوط به فناوری و کاربردهای audio-novel.
-
#3بازیابی صوتی بینحالتی با پرسوجوهای زبان طبیعیتحقیق در مورد بازیابی صوت با استفاده از پرسوجوهای زبان طبیعی آزاد، معرفی معیارها و خطوط پایه جدید برای بازیابی صوتی بینحالتی
-
#4AudioBoost: بهبود کشف کتابهای صوتی در جستجوی اسپاتیفای از طریق پرسوجوهای مصنوعی تولیدشده توسط مدلهای زبانی بزرگتحلیل سیستم AudioBoost که از مدلهای زبانی بزرگ برای تولید پرسوجوهای مصنوعی از فرادادههای کتابهای صوتی، به منظور بهبود بازیابی و پیشنهادات جستجو در سناریوی شروع سرد اسپاتیفای استفاده میکند.
-
#5Audiobook-CC: یک چارچوب برای تولید کنترلشدهی کتابهای صوتی چندصدایی با زمینهی طولانیتحلیل Audiobook-CC، یک چارچوب نوین ترکیب گفتار برای تولید کتابهای صوتی چندصدایی منسجم و دارای بیان عاطفی با کنترل دقیق و مدلسازی زمینهی طولانی.
-
#6Audiobook-CC: یک چارچوب برای تولید کنترلپذیر کتابهای صوتی چندگانه با زمینهی طولانیتحلیل Audiobook-CC، یک چارچوب TTS نوآورانه برای تولید کتابهای صوتی چندگانه منسجم، دارای بیان احساسی و سازگار با زمینه، همراه با کنترل دقیق.
-
#7توصیههای شخصیسازیشده کتابهای صوتی در اسپاتیفای از طریق شبکههای عصبی گرافسیستم نوآورانه 2T-HGNN اسپاتیفای که شبکههای عصبی گراف ناهمگن و مدلهای دو برجی را برای توصیههای مقیاسپذیر کتاب صوتی ترکیب میکند و 46٪ افزایش نرخ شروع را محقق کرده است.
-
#8MAMLCon: فراآموزش برای طبقهبندی کلمات گفتاری پیوسته با نمونههای کمیک رویکرد نوین فراآموزش (MAMLCon) که فراموشی فاجعهبار در یادگیری پیوسته با نمونههای کم برای طبقهبندی کلمات گفتاری را کاهش میدهد و از روشهای موجود مانند OML عملکرد بهتری دارد.
-
#9کتابهای صوتی موبایلی برای درک شنیداری زبان انگلیسی به عنوان زبان خارجی: چارچوبی برای دانشجویان دانشگاهتحلیل ادغام کتابهای صوتی موبایلی برای توسعه مهارتهای درک شنیداری در دانشجویان دانشگاهی زبان انگلیسی به عنوان زبان خارجی، شامل مزایا، معیارهای انتخاب، مراحل آموزشی و ارزیابی.
-
#10Movie101v2: یک معیار بهبودیافته برای تولید خودکار روایت فیلمتحلیل Movie101v2، یک مجموعه داده دوزبانه بزرگ برای روایت فیلم، شامل نقشه راه سه مرحلهای، ارزیابیهای پایه و جهتهای تحقیقاتی آینده.
-
#11تأثیر موسیقی و کلام بر تشخیص کلام گفتاری: تحلیل و پیامدهاتحقیقی در مورد چگونگی تأثیر موسیقی پسزمینه با و بدون کلام بر تشخیص کلمات گفتاری، با پیامدهایی برای محیطهای اجتماعی و کارهای آینده.
-
#12واندرفلو: طراحی ویدئوهای دادهای متحرک با محوریت روایتیک ابزار نویسندگی تعاملی که با پیوند دادن روایت به انیمیشنهای نمودار و ارائه جلوههای متحرک ساختارآگاه، ایجاد ویدئوهای دادهای متحرک را ساده میکند.
-
#13تولید روایت برای ویدیوهای کارتونی: صورتبندی وظیفه، مجموعه داده و مدلهااین مقاله وظیفه جدید تولید روایت برای ویدیوها را معرفی میکند، یک مجموعه داده از پپا پیگ ارائه میدهد و مدلهایی برای زمانبندی و تولید محتوا پیشنهاد میکند.
-
#14یک مدل آوایی برای پردازش کلمات گفتاری غیربومی: تحلیل و بینشهاتحلیل یک مدل محاسباتی که نقش ادراک آوایی را در پردازش کلمات غیربومی بررسی میکند و توضیحات سنتی واجشناختی را به چالش میکشد.
-
#15تعبیه آوایی و معنایی واژگان گفتاری با کاربرد در بازیابی محتوای گفتاریچارچوبی دو مرحلهای برای تعبیه واژگان گفتاری با اطلاعات آوایی و معنایی، که امکان بازیابی پیشرفته اسناد گفتاری فراتر از تطبیق ساده اصطلاحات را فراهم میکند.
-
#16تحلیل آهنگ گفتار کتابهای صوتی: مدلهای پردازش زبان طبیعی برای بهبود متن-به-گفتارپژوهشی در زمینه پیشبینی ویژگیهای آهنگ گفتار (زیروبمی، بلندی، سرعت) از متن روایی با استفاده از پردازش زبان طبیعی و مدلهای زبانی، به منظور بهبود تولید کتابهای صوتی.
-
#17تشخیص عمل با نظارت ضعیف هدایتشده توسط روایت صوتیمقالهای پژوهشی که چگونگی استفاده از روایت صوتی نویزی به عنوان نظارت ضعیف برای آموزش مدلهای تشخیص عمل در ویدیو را بررسی میکند تا هزینههای حاشیهنویسی کاهش یابد و در عین حال از ویژگیهای چندوجهی استفاده شود.
-
#18MultiActor-Audiobook: تولید کتابهای صوتی با چندین گوینده به صورت Zero-Shotروشی zero-shot برای تولید کتابهای صوتی بیان با استفاده از پرسوناهای چندوجهی گوینده و دستورات مبتنی بر LLM، حذف نیاز به آموزش پرهزینه و حاشیهنویسی دستی
-
#19MultiActor-Audiobook: تولید صوتی کتاب با چهرهها و صداها به صورت Zero-Shotتحلیل فنی MultiActor-Audiobook، یک سیستم نوین Zero-Shot برای تولید کتابهای صوتی بیانی با استفاده از پرسوناهای چندوجهی گوینده و دستورالعملهای مبتنی بر LLM.
آخرین بروزرسانی: 2026-01-12 05:31:33