-
#1Dil Modellerinin Kurgu Üretimi İçin Dünya Görüşünün DeğerlendirilmesiBüyük Dil Modellerinin tutarlı kurgusal dünyaları sürdürme yeteneğinin analizi, yaratıcı yazarlık için anlatı tutarlılığı ve durum koruma konusundaki sınırlamaları ortaya koyuyor.
-
#2audio-novel - Teknik Dokümantasyon ve Kaynaklaraudio-novel teknolojisi ve uygulamaları hakkında kapsamlı teknik dokümantasyon ve kaynaklar.
-
#3Sesli Kitap Deneyimini Kavramsallaştırmak: Teorik Bir ÇerçeveBasılı kitap okuma ile sesli kitap dinleme arasındaki farkları kavramsallaştırmaya yönelik teorik bir çerçevenin, mobil dinleme pratiklerine vurgu yapılarak analizi.
-
#4AudioBoost: Spotify Arama'da Sesli Kitap Keşfini LLM ile Üretilen Sentetik Sorgularla GeliştirmeSpotify'ın soğuk başlangıç senaryosunda, sesli kitap meta verilerinden LLM'lerle sentetik sorgular üreterek erişilebilirliği ve sorgu önerilerini iyileştiren AudioBoost sisteminin analizi.
-
#5AudioBoost: Spotify Arama'da Sesli Kitap Keşfini LLM ile Üretilen Sentetik Sorgularla GeliştirmeAudioBoost sisteminin, Spotify'ın arama motorunda soğuk başlangıç senaryolarında sesli kitap erişilebilirliğini artırmak için Büyük Dil Modelleri kullanarak sentetik sorgular üretmesinin analizi.
-
#6Audiobook-CC: Kontrollü Uzun Bağlamlı Çoklu Seslendirmeli Sesli Kitap Üretimi için Bir ÇerçeveAudiobook-CC'nin analizi: İnce taneli kontrol ve uzun bağlam modellemesi ile tutarlı, duygusal açıdan ifadeli çoklu seslendirmeli sesli kitaplar üretmek için yeni bir konuşma sentezi çerçevesi.
-
#7Audiobook-CC: Kontrollü Uzun Bağlamlı Çoklu Seslendirmeli Sesli Kitap Üretimi için Bir ÇerçeveAudiobook-CC'nin analizi: İnce taneli kontrole sahip, tutarlı, duygusal ifadeli ve bağlamsal olarak tutarlı çoklu seslendirmeli sesli kitaplar üretmek için yeni bir Metinden Sese (TTS) çerçevesi.
-
#8'Dijital Sesli Kitaplar: Yeni Medya, Kullanıcılar ve Deneyimler' Üzerine Bir Analiz - Medya Çalışmaları PerspektifiMedyalaşma teorisi, post-fenomenoloji ve ses tabanlı edebiyat tüketiminin evrimini inceleyen 'Dijital Sesli Kitaplar' kitap eleştirisi üzerine eleştirel bir analiz.
-
#9Sesli Kitapların Uçtan Uca Otomatik Konuşma Çevirisi: Derlem, Modeller ve AnalizZenginleştirilmiş bir sesli kitap derlemi üzerinde uçtan uca konuşmadan metne çeviri modellerinin analizi, eğitim senaryoları ve model verimliliğinin incelenmesi.
-
#10Spotify'da Grafik Sinir Ağları ile Kişiselleştirilmiş Sesli Kitap ÖnerileriSpotify'ın Heterojen Grafik Sinir Ağları ve İki Kule modellerini birleştiren yenilikçi 2T-HGNN sistemi, ölçeklenebilir sesli kitap önerileriyle %46 başlama oranı artışı sağlıyor.
-
#11J-MAC: Konuşma Sentezi için Japonca Çok Konuşmacılı Sesli Kitap DerlemiJ-MAC derlemi oluşturma metodolojisi, teknik katkılar, değerlendirme sonuçları ve ifadeli sesli kitap konuşma sentezi için gelecek yönelimlerin analizi.
-
#12Yabancı Dil Olarak İngilizce Dinleme Anlama için Mobil Sesli Kitaplar: Üniversite Öğrencileri için Bir ÇerçeveYabancı Dil Olarak İngilizce (EFL) öğrenen üniversite öğrencilerinde dinleme anlama becerilerini geliştirmek için Mobil Sesli Kitapların (MAB) entegrasyonuna yönelik analiz ve çerçeve; avantajlar, seçim, uygulama ve değerlendirmeyi kapsar.
-
#13Yabancı Dil Olarak İngilizce Dinleme Anlama için Mobil Sesli Kitaplar: Üniversite Öğrencileri için Bir ÇerçeveYabancı dil olarak İngilizce öğrenen üniversite öğrencilerinin dinleme becerilerini geliştirmek için mobil sesli kitapların entegrasyonuna yönelik analiz ve çerçeve; avantajlar, seçim, uygulama ve değerlendirme konularını kapsar.
-
#14Movie101v2: Otomatik Film Anlatımı Üretimi için Geliştirilmiş Bir Kıyaslama Veri SetiMovie101v2'nin analizi: film anlatımı için büyük ölçekli iki dilli bir veri seti, üç aşamalı görev yol haritası, temel değerlendirmeler ve gelecek araştırma yönleri.
-
#15Müzik ve Şarkı Sözlerinin Konuşma Tanıma Üzerindeki Etkisi: Analiz ve ÇıkarımlarArka planda çalan müzik ve sözlerin konuşma tanımaya etkisini inceleyen araştırmanın analizi; sosyal ortamlar ve gelecek çalışmalar için çıkarımlar.
-
#16WonderFlow: Anlatım Odaklı Animasyonlu Veri Videoları TasarımıAnlatımı grafik animasyonlarına bağlayarak ve yapıya duyarlı animasyon efektleri sağlayarak animasyonlu veri videoları oluşturmayı kolaylaştıran etkileşimli bir yazarlık aracı.
-
#17Çizgi Film Videoları için Anlatı Üretimi: Görev Tanımı, Veri Kümesi ve ModellerVideolar için otomatik anlatı üretimi görevini tanıtan, Peppa Pig'dan yeni bir veri kümesi sunan ve zamanlama ile içerik üretimi için modeller öneren bir araştırma makalesi.
-
#18Anadili Olmayan Konuşma Kelime İşlemenin Fonetik Bir Modeli: Analiz ve İçgörülerFonetik algının anadili olmayan kelime işlemedeki rolünü araştıran bir hesaplamalı model analizi; geleneksel fonolojik açıklamalara meydan okuyor.
-
#19Konuşma Kelimelerinin Fonetik ve Semantik Gömülmesi ve Konuşma İçeriği Erişiminde UygulamalarıKonuşma kelimelerini hem fonetik hem de semantik bilgiyle gömüleyen, basit terim eşleştirmenin ötesinde gelişmiş konuşma belgesi erişimi sağlayan iki aşamalı bir çerçeve.
-
#20Sesli Kitaplarda Prozodi Analizi: Metinden Sese Dönüşümü Geliştirmek için NLP ModelleriAnlatı metninden NLP ve dil modelleri kullanarak prozodi özelliklerini (perde, ses şiddeti, konuşma hızı) tahmin etme araştırması, sesli kitap oluşturma için TTS'yi iyileştiriyor.
-
#21Sesli Anlatım ile Yönlendirilen Zayıf Denetimli Eylem TespitiGürültülü sesli anlatımın, çok modlu video özelliklerinden yararlanırken açıklama maliyetlerini düşürmek için zayıf denetim olarak eylem tespit modellerini eğitmek amacıyla nasıl kullanılacağını araştıran bir araştırma makalesi.
-
#22MultiActor-SesliKitap: Çoklu Konuşmacı ile Sıfırdan ÜretimÇok modlu konuşmacı profilleri ve LLM tabanlı senaryo talimatları kullanarak ifadeli sesli kitaplar üreten, maliyetli eğitim ve manuel etiketleme gerektirmeyen sıfırdan bir yaklaşım.
-
#23MultiActor-Audiobook: Yüzler ve Seslerle Sıfırdan ÜretimMultiActor-Audiobook'un, çok modlu konuşmacı kişilikleri ve LLM tabanlı senaryo talimatları kullanarak ifadeli sesli kitaplar üreten yeni bir sıfırdan sistemin teknik analizi.
Son güncelleme: 2026-02-25 12:01:16