-
#1audio-novel - Dokumentasi dan Sumber TeknikalDokumentasi teknikal komprehensif dan sumber tentang teknologi dan aplikasi audio-novel.
-
#2Pencarian Audio Rentas Moda dengan Pertanyaan Bahasa Semula JadiKajian tentang pencarian audio menggunakan pertanyaan bahasa semula jadi bentuk bebas, memperkenalkan penanda aras dan garis dasar baharu untuk pencarian audio rentas moda.
-
#3AudioBoost: Meningkatkan Penemuan Buku Audio dalam Carian Spotify melalui Kueri Sintetik Dijana LLMAnalisis AudioBoost, sistem yang menggunakan LLM untuk menjana kueri sintetik daripada metadata buku audio bagi meningkatkan pencarian dan cadangan kueri dalam senario permulaan sejuk Spotify.
-
#4Audiobook-CC: Rangka Kerja untuk Penjanaan Buku Audio Multicast Konteks Panjang yang Boleh DikawalAnalisis Audiobook-CC, rangka kerja sintesis pertuturan novel untuk menjana buku audio multicast yang koheren, ekspresif emosi dengan kawalan halus dan pemodelan konteks panjang.
-
#5Audiobook-CC: Rangka Kerja untuk Penjanaan Buku Audio Multicast Konteks Panjang yang Boleh DikawalAnalisis Audiobook-CC, rangka kerja TTS novel untuk menjana buku audio multicast yang koheren, ekspresif emosi, konsisten konteks dengan kawalan halus.
-
#6Cadangan Buku Audio Peribadi di Spotify Melalui Rangkaian Neural GrafSistem 2T-HGNN inovatif Spotify menggabungkan Rangkaian Neural Graf Heterogen dan model Dua Menara untuk cadangan buku audio berskala besar, mencapai peningkatan +46% kadar permulaan.
-
#7MAMLCon: Meta-Pembelajaran untuk Pengelasan Perkataan Bertutur Berterusan dengan Sampel SedikitPendekatan meta-pembelajaran baharu (MAMLCon) yang mengurangkan lupa bencana dalam pembelajaran berterusan dengan sampel sedikit untuk pengelasan perkataan bertutur, mengatasi kaedah sedia ada seperti OML.
-
#8Buku Audio Mudah Alih untuk Kefahaman Mendengar EFL: Kerangka Kerja untuk Pelajar KolejAnalisis integrasi buku audio mudah alih untuk membina kemahiran kefahaman mendengar dalam kalangan pelajar kolej EFL, merangkumi kelebihan, kriteria pemilihan, fasa pengajaran dan penilaian.
-
#9Movie101v2: Penanda Aras yang Dipertingkat untuk Penjanaan Naratif Filem AutomatikAnalisis Movie101v2, set data dwibahasa berskala besar untuk naratif filem, termasuk pelan tugas tiga peringkat, penilaian asas, dan hala tuju penyelidikan masa depan.
-
#10Kesan Muzik dan Lirik terhadap Pengecaman Perkataan Lisan: Analisis dan ImplikasiAnalisis penyelidikan tentang bagaimana muzik latar dengan dan tanpa lirik mempengaruhi pengecaman perkataan lisan, dengan implikasi untuk tetapan sosial dan kerja masa depan.
-
#11WonderFlow: Reka Bentuk Video Data Animasi Berpusatkan NaratifSatu alat pengarangan interaktif yang memudahkan penciptaan video data animasi dengan menghubungkan naratif kepada animasi carta dan menyediakan kesan animasi yang sedar struktur.
-
#12Penjanaan Naratif untuk Video Kartun: Pemformalan Tugas, Set Data, dan ModelKertas kerja ini memperkenalkan tugas baharu penjanaan naratif untuk video, membentangkan set data dari Peppa Pig, dan mencadangkan model untuk penentuan masa dan penjanaan kandungan.
-
#13Model Fonetik untuk Pemprosesan Perkataan Pertuturan Bukan Asli: Analisis dan HuraianAnalisis model pengiraan yang meneroka peranan persepsi fonetik dalam pemprosesan perkataan bukan asli, mencabar penjelasan fonologi tradisional.
-
#14Penyematan Fonetik dan Semantik bagi Perkataan Percakapan dengan Aplikasi dalam Pencarian Kandungan PercakapanRangka kerja dua peringkat untuk menyemat perkataan percakapan dengan maklumat fonetik dan semantik, membolehkan pencarian dokumen percakapan termaju melebihi padanan istilah mudah.
-
#15Analisis Prosodi Buku Audio: Model NLP untuk Penambahbaikan Teks-ke-PertuturanKajian meramal atribut prosodi (nada, kelantangan, kadar) daripada teks naratif menggunakan NLP dan model bahasa, meningkatkan TTS untuk penjanaan buku audio.
-
#16Pengelasan Pencerita Tidak Boleh Dipercayai dengan Model Bahasa BesarKajian pengenalpastian pengiraan pencerita tidak boleh dipercayai menggunakan LLM, menampilkan dataset TUN A dan klasifikasi ketidakbolehpercayaan intra-naratif, inter-naratif dan inter-teks.
-
#17Pengesanan Tindakan Berpandukan Naratif Audio dengan Penyeliaan LemahKertas penyelidikan meneroka cara menggunakan naratif audio yang bising sebagai penyeliaan lemah untuk melatih model pengesanan tindakan video, mengurangkan kos anotasi sambil memanfaatkan ciri multimodal.
-
#18MultiActor-Audiobook: Penjanaan Zero-Shot dengan Pelbagai PenuturPendekatan zero-shot untuk menjana buku audio ekspresif menggunakan persona penutur multimodal dan arahan skrip berasaskan LLM, menghapuskan keperluan latihan mahal dan anotasi manual.
-
#19MultiActor-Audiobook: Penjanaan Sifar-Tembak dengan Wajah dan SuaraAnalisis teknikal MultiActor-Audiobook, sistem sifar-tembak novel untuk menjana buku audio ekspresif menggunakan persona pencerita multimodal dan arahan skrip berasaskan LLM.
Kemaskini terakhir: 2026-01-12 05:31:34