-
#1Menilai Pandangan Alam Model Bahasa untuk Penjanaan FiksyenAnalisis keupayaan LLM mengekalkan dunia fiksyen yang konsisten, mendedahkan batasan dalam koheren naratif dan pengekalan keadaan untuk penulisan kreatif.
-
#2audio-novel - Dokumentasi dan Sumber TeknikalDokumentasi teknikal komprehensif dan sumber tentang teknologi dan aplikasi audio-novel.
-
#3Pencarian Audio Rentas Moda dengan Pertanyaan Bahasa Semula JadiKajian tentang pencarian audio menggunakan pertanyaan bahasa semula jadi bentuk bebas, memperkenalkan penanda aras dan garis dasar baharu untuk pencarian audio rentas moda.
-
#4Mengkonsepkan Pengalaman Buku Audio: Satu Kerangka TeoriAnalisis kerangka teori untuk mengkonsepkan perbezaan antara membaca buku bercetak dan mendengar buku audio, menekankan amalan mendengar mudah alih.
-
#5AudioBoost: Meningkatkan Penemuan Buku Audio dalam Carian Spotify melalui Kueri Sintetik Dijana LLMAnalisis AudioBoost, sistem yang menggunakan LLM untuk menjana kueri sintetik daripada metadata buku audio bagi meningkatkan pencarian dan cadangan kueri dalam senario permulaan sejuk Spotify.
-
#6AudioBoost: Meningkatkan Penemuan Buku Audio dalam Carian Spotify melalui Pertanyaan Sintetik Dijana LLMAnalisis AudioBoost, sistem yang menggunakan Model Bahasa Besar untuk menjana pertanyaan sintetik bagi meningkatkan kebolehcapian buku audio dalam enjin carian Spotify semasa senario permulaan sejuk.
-
#7Audiobook-CC: Rangka Kerja untuk Penjanaan Buku Audio Multicast Konteks Panjang yang Boleh DikawalAnalisis Audiobook-CC, rangka kerja sintesis pertuturan novel untuk menjana buku audio multicast yang koheren, ekspresif emosi dengan kawalan halus dan pemodelan konteks panjang.
-
#8Audiobook-CC: Rangka Kerja untuk Penjanaan Buku Audio Multicast Konteks Panjang yang Boleh DikawalAnalisis Audiobook-CC, rangka kerja TTS novel untuk menjana buku audio multicast yang koheren, ekspresif emosi, konsisten konteks dengan kawalan halus.
-
#9Analisis 'Buku Audio Digital: Media Baharu, Pengguna, dan Pengalaman' - Perspektif Kajian MediaAnalisis kritis terhadap ulasan buku 'Buku Audio Digital' yang meneroka teori mediatisasi, pasca-fenomenologi, dan landskap penggunaan sastera berasaskan audio yang berkembang.
-
#10Terjemahan Pertuturan ke Teks Secara Hujung-ke-Hujung untuk Buku Audio: Korpus, Model & AnalisisAnalisis model terjemahan pertuturan-ke-teks hujung-ke-hujung pada korpus buku audio yang dipertingkat, meneroka senario latihan dan kecekapan model.
-
#11Muzik dan Aras Naratif dalam Filem: Satu Analisis NaratologiAnalisis mendalam muzik filem melalui lensa naratologi, meneroka fungsi muzik merentasi pelbagai aras naratif dalam sinema.
-
#12Cadangan Buku Audio Peribadi di Spotify Melalui Rangkaian Neural GrafSistem 2T-HGNN inovatif Spotify menggabungkan Rangkaian Neural Graf Heterogen dan model Dua Menara untuk cadangan buku audio berskala besar, mencapai peningkatan +46% kadar permulaan.
-
#13J-MAC: Korpus Buku Audio Berbilang Penutur Bahasa Jepun untuk Sintesis PertuturanAnalisis metodologi pembinaan korpus J-MAC, sumbangan teknikal, keputusan penilaian, dan hala tuju masa depan untuk sintesis pertuturan buku audio yang ekspresif.
-
#14MAMLCon: Meta-Pembelajaran untuk Pengelasan Perkataan Bertutur Berterusan dengan Sampel SedikitPendekatan meta-pembelajaran baharu (MAMLCon) yang mengurangkan lupa bencana dalam pembelajaran berterusan dengan sampel sedikit untuk pengelasan perkataan bertutur, mengatasi kaedah sedia ada seperti OML.
-
#15Buku Audio Mudah Alih untuk Kefahaman Mendengar EFL: Kerangka Kerja untuk Pelajar KolejAnalisis dan kerangka kerja untuk mengintegrasikan Buku Audio Mudah Alih (MAB) bagi membangunkan kemahiran kefahaman mendengar dalam kalangan pelajar kolej EFL, merangkumi kelebihan, pemilihan, pelaksanaan, dan penilaian.
-
#16Buku Audio Mudah Alih untuk Kefahaman Mendengar EFL: Kerangka Kerja untuk Pelajar KolejAnalisis dan kerangka kerja untuk mengintegrasikan buku audio mudah alih bagi membangunkan kemahiran kefahaman mendengar dalam kalangan pelajar kolej EFL, merangkumi kelebihan, pemilihan, pelaksanaan dan penilaian.
-
#17Movie101v2: Penanda Aras yang Dipertingkat untuk Penjanaan Naratif Filem AutomatikAnalisis Movie101v2, set data dwibahasa berskala besar untuk naratif filem, termasuk pelan tugas tiga peringkat, penilaian asas, dan hala tuju penyelidikan masa depan.
-
#18Kesan Muzik dan Lirik terhadap Pengecaman Perkataan Lisan: Analisis dan ImplikasiAnalisis penyelidikan tentang bagaimana muzik latar dengan dan tanpa lirik mempengaruhi pengecaman perkataan lisan, dengan implikasi untuk tetapan sosial dan kerja masa depan.
-
#19WonderFlow: Reka Bentuk Video Data Animasi Berpusatkan NaratifSatu alat pengarangan interaktif yang memudahkan penciptaan video data animasi dengan menghubungkan naratif kepada animasi carta dan menyediakan kesan animasi yang sedar struktur.
-
#20Penjanaan Naratif untuk Video Kartun: Pemformalan Tugas, Set Data, dan ModelKertas penyelidikan memperkenalkan tugas penjanaan naratif automatik untuk video, membentangkan set data baharu dari Peppa Pig, dan mencadangkan model untuk penentuan masa dan penjanaan kandungan.
-
#21Model Fonetik untuk Pemprosesan Perkataan Pertuturan Bukan Asli: Analisis dan HuraianAnalisis model pengiraan yang meneroka peranan persepsi fonetik dalam pemprosesan perkataan bukan asli, mencabar penjelasan fonologi tradisional.
-
#22Penyematan Fonetik dan Semantik bagi Perkataan Percakapan dengan Aplikasi dalam Pencarian Kandungan PercakapanRangka kerja dua peringkat untuk menyemat perkataan percakapan dengan maklumat fonetik dan semantik, membolehkan pencarian dokumen percakapan termaju melebihi padanan istilah mudah.
-
#23Analisis Prosodi Buku Audio: Model NLP untuk Penambahbaikan Teks-ke-PertuturanKajian meramal atribut prosodi (nada, kelantangan, kadar) daripada teks naratif menggunakan NLP dan model bahasa, meningkatkan TTS untuk penjanaan buku audio.
-
#24Pengelasan Pencerita Tidak Boleh Dipercayai dengan Model Bahasa BesarKajian pengenalpastian pengiraan pencerita tidak boleh dipercayai menggunakan LLM, menampilkan dataset TUN A dan klasifikasi ketidakbolehpercayaan intra-naratif, inter-naratif dan inter-teks.
-
#25Pengesanan Tindakan Berpandukan Naratif Audio dengan Penyeliaan LemahKertas penyelidikan meneroka penggunaan naratif audio yang bising sebagai penyeliaan lemah untuk melatih model pengesanan tindakan, mengurangkan kos anotasi sambil memanfaatkan ciri video multimodal.
-
#26MultiActor-Audiobook: Penjanaan Zero-Shot dengan Pelbagai PenuturPendekatan zero-shot untuk menjana buku audio ekspresif menggunakan persona penutur multimodal dan arahan skrip berasaskan LLM, menghapuskan keperluan latihan mahal dan anotasi manual.
-
#27MultiActor-Audiobook: Penjanaan Sifar-Tembak dengan Wajah dan SuaraAnalisis teknikal MultiActor-Audiobook, sistem sifar-tembak novel untuk menjana buku audio ekspresif menggunakan persona pencerita multimodal dan arahan skrip berasaskan LLM.
Kemaskini terakhir: 2026-02-25 12:01:15