-
#1評估語言模型在小說生成中的世界觀建構能力分析大型語言模型維持虛構世界一致性的能力,揭示其在創意寫作中敘事連貫性與狀態保留方面的限制。
-
#2audio-novel - 技術文件與資源關於audio-novel技術與應用的全面技術文件與資源。
-
#3基於自然語言查詢的跨模態音訊檢索研究使用自由格式自然語言查詢檢索音訊,為跨模態音訊檢索引入新基準與基線方法。
-
#4有聲書體驗的概念化:一個理論框架分析有聲書與印刷書籍差異的理論框架,強調數位科技下的行動聆聽實踐。
-
#5AudioBoost:透過LLM生成合成查詢,提升Spotify搜尋中的有聲書探索分析AudioBoost系統,其運用LLM從有聲書元數據生成合成查詢,以改善Spotify冷啟動情境下的檢索與查詢建議。
-
#6AudioBoost:透過LLM生成合成查詢,提升Spotify搜尋中的有聲書探索能力分析AudioBoost系統,該系統使用大型語言模型生成合成查詢,以解決Spotify搜尋引擎中有聲書在冷啟動情境下的可檢索性問題。
-
#7Audiobook-CC:一個可控的長上下文多角色有聲書生成框架分析Audiobook-CC,這是一個用於生成連貫、情感豐富且具細粒度控制與長上下文建模能力的多角色有聲書之新穎語音合成框架。
-
#8Audiobook-CC:一個可控的長上下文多播有聲書生成框架分析 Audiobook-CC,這是一個新穎的 TTS 框架,用於生成連貫、情感豐富、上下文一致且具備細粒度控制的多播有聲書。
-
#9《數位有聲書:新媒體、使用者與體驗》分析——從媒體研究視角出發針對《數位有聲書》書評的批判性分析,探討中介化理論、後現象學,以及音訊文學消費的演變格局。
-
#10有聲書的端到端自動語音翻譯:語料庫、模型與分析分析在增強型有聲書語料庫上的端到端語音轉文字翻譯模型,探討訓練情境與模型效率。
-
#11電影中的音樂與敘事層級:敘事學分析透過敘事學視角深入分析電影音樂,探討音樂在電影不同敘事層級中的功能與運作方式。
-
#12Spotify透過圖神經網路實現個人化有聲書推薦Spotify創新的2T-HGNN系統結合異質圖神經網路與雙塔模型,實現可擴展的有聲書推薦,使開始收聽率提升46%。
-
#13J-MAC:用於語音合成的日語多說話者有聲書語料庫分析J-MAC語料庫建構方法、技術貢獻、評估結果,以及富有表現力的有聲書語音合成未來發展方向。
-
#14MAMLCon:用於持續性少量樣本口語詞彙分類的元學習方法一種新穎的元學習方法(MAMLCon),能減輕口語詞彙分類在持續性少量樣本學習中的災難性遺忘問題,表現優於OML等現有方法。
-
#15行動有聲書於EFL聽力理解之應用:大學生適用框架分析並整合行動有聲書(MABs)以發展EFL大學生聽力理解技能之框架,涵蓋優勢、選擇、實施與評估。
-
#16行動有聲書於EFL聽力理解之應用:大學生學習架構分析並提出整合行動有聲書以發展EFL大學生聽力理解技能之架構,涵蓋優勢、選擇、實施與評估。
-
#17Movie101v2:一個改進的自動電影旁白生成基準分析用於電影旁白的大規模雙語資料集Movie101v2,包括其三階段任務路線圖、基準評估與未來研究方向。
-
#18音樂與歌詞對口語詞彙辨識的影響:分析與啟示分析背景音樂(含歌詞與不含歌詞)如何影響口語詞彙辨識的研究,探討其對社交場域及未來工作的啟示。
-
#19WonderFlow:以敘事為核心的動態資料影片設計一款互動式創作工具,透過將敘事與圖表動畫連結,並提供結構感知的動畫效果,簡化動態資料影片的製作過程。
-
#20卡通影片旁白生成:任務形式化、資料集與模型一篇研究論文,介紹影片自動旁白生成任務,提出一個來自《粉紅豬小妹》的新資料集,並提出時序與內容生成模型。
-
#21非母語口語詞彙處理的語音模型:分析與洞見分析一個探討語音感知在非母語詞彙處理中作用的計算模型,挑戰傳統的音韻學解釋。
-
#22語音與語義融合之口語詞嵌入技術及其在口語內容檢索之應用一個兩階段框架,用於嵌入同時包含語音與語義資訊的口語詞彙,實現超越簡單詞彙匹配的進階口語文件檢索。
-
#23有聲書韻律分析:用於增強文字轉語音的NLP模型研究利用NLP與語言模型從敘事文本預測韻律屬性(音高、音量、語速),以提升有聲書生成之文字轉語音品質。
-
#24使用大型語言模型分類不可靠敘事者利用LLMs計算識別不可靠敘事者之研究,包含TUN A資料集及敘事內、敘事間與文本間不可靠性分類。
-
#25以音訊旁白引導的弱監督動作偵測本研究探討如何利用帶有雜訊的音訊旁白作為弱監督訊號來訓練動作偵測模型,在降低標註成本的同時,充分利用多模態影片特徵。
-
#26MultiActor-Audiobook:多說話者零樣本生成技術運用多模態說話者角色設定與基於LLM的腳本指令,實現無需昂貴訓練與人工標註的零樣本有聲書生成方法。
-
#27MultiActor-Audiobook:結合面孔與聲音的零樣本生成技術針對MultiActor-Audiobook的技術分析,這是一個利用多模態說話者角色與基於LLM的腳本指令,生成富有表現力有聲書的新穎零樣本系統。
最後更新: 2026-02-25 12:01:16