-
#1audio-novel - Teknik Dokümantasyon ve Kaynaklaraudio-novel teknolojisi ve uygulamaları hakkında kapsamlı teknik dokümantasyon ve kaynaklar.
-
#2AudioBoost: Spotify Arama'da Sesli Kitap Keşfini LLM ile Üretilen Sentetik Sorgularla GeliştirmeSpotify'ın soğuk başlangıç senaryosunda, sesli kitap meta verilerinden LLM'lerle sentetik sorgular üreterek erişilebilirliği ve sorgu önerilerini iyileştiren AudioBoost sisteminin analizi.
-
#3Audiobook-CC: Kontrollü Uzun Bağlamlı Çoklu Seslendirmeli Sesli Kitap Üretimi için Bir ÇerçeveAudiobook-CC'nin analizi: İnce taneli kontrol ve uzun bağlam modellemesi ile tutarlı, duygusal açıdan ifadeli çoklu seslendirmeli sesli kitaplar üretmek için yeni bir konuşma sentezi çerçevesi.
-
#4Audiobook-CC: Kontrollü Uzun Bağlamlı Çoklu Seslendirmeli Sesli Kitap Üretimi için Bir ÇerçeveAudiobook-CC'nin analizi: İnce taneli kontrole sahip, tutarlı, duygusal ifadeli ve bağlamsal olarak tutarlı çoklu seslendirmeli sesli kitaplar üretmek için yeni bir Metinden Sese (TTS) çerçevesi.
-
#5Spotify'da Grafik Sinir Ağları ile Kişiselleştirilmiş Sesli Kitap ÖnerileriSpotify'ın Heterojen Grafik Sinir Ağları ve İki Kule modellerini birleştiren yenilikçi 2T-HGNN sistemi, ölçeklenebilir sesli kitap önerileriyle %46 başlama oranı artışı sağlıyor.
-
#6Yabancı Dil Olarak İngilizce Dinleme Anlama için Mobil Sesli Kitaplar: Üniversite Öğrencileri için Bir ÇerçeveYabancı dil olarak İngilizce öğrenen üniversite öğrencilerinin dinleme anlama becerilerini geliştirmek için mobil sesli kitapların entegrasyonunun analizi; avantajlar, seçim kriterleri, öğretim aşamaları ve değerlendirme konularını kapsar.
-
#7Movie101v2: Otomatik Film Anlatımı Üretimi için Geliştirilmiş Bir Kıyaslama Veri SetiMovie101v2'nin analizi: film anlatımı için büyük ölçekli iki dilli bir veri seti, üç aşamalı görev yol haritası, temel değerlendirmeler ve gelecek araştırma yönleri.
-
#8Müzik ve Şarkı Sözlerinin Konuşma Tanıma Üzerindeki Etkisi: Analiz ve ÇıkarımlarArka planda çalan müzik ve sözlerin konuşma tanımaya etkisini inceleyen araştırmanın analizi; sosyal ortamlar ve gelecek çalışmalar için çıkarımlar.
-
#9WonderFlow: Anlatım Odaklı Animasyonlu Veri Videoları TasarımıAnlatımı grafik animasyonlarına bağlayarak ve yapıya duyarlı animasyon efektleri sağlayarak animasyonlu veri videoları oluşturmayı kolaylaştıran etkileşimli bir yazarlık aracı.
-
#10Çizgi Film Videoları için Anlatı Üretimi: Görev Tanımı, Veri Kümesi ve ModellerBu makale, video anlatı üretimi için yeni bir görev tanıtıyor, Peppa Pig'den bir veri kümesi sunuyor ve zamanlama ile içerik üretimi için modeller öneriyor.
-
#11Anadili Olmayan Konuşma Kelime İşlemenin Fonetik Bir Modeli: Analiz ve İçgörülerFonetik algının anadili olmayan kelime işlemedeki rolünü araştıran bir hesaplamalı model analizi; geleneksel fonolojik açıklamalara meydan okuyor.
-
#12Konuşma Kelimelerinin Fonetik ve Semantik Gömülmesi ve Konuşma İçeriği Erişiminde UygulamalarıKonuşma kelimelerini hem fonetik hem de semantik bilgiyle gömüleyen, basit terim eşleştirmenin ötesinde gelişmiş konuşma belgesi erişimi sağlayan iki aşamalı bir çerçeve.
-
#13Sesli Kitaplarda Prozodi Analizi: Metinden Sese Dönüşümü Geliştirmek için NLP ModelleriAnlatı metninden NLP ve dil modelleri kullanarak prozodi özelliklerini (perde, ses şiddeti, konuşma hızı) tahmin etme araştırması, sesli kitap oluşturma için TTS'yi iyileştiriyor.
-
#14Sesli Anlatımla Yönlendirilen Zayıf Denetimli Eylem TespitiGürültülü sesli anlatımların, video eylem tespiti modellerini eğitmek için zayıf denetim olarak nasıl kullanılabileceğini araştıran, çok modlu özelliklerden yararlanırken açıklama maliyetlerini düşüren bir araştırma makalesi.
-
#15MultiActor-SesliKitap: Çoklu Konuşmacı ile Sıfırdan ÜretimÇok modlu konuşmacı profilleri ve LLM tabanlı senaryo talimatları kullanarak ifadeli sesli kitaplar üreten, maliyetli eğitim ve manuel etiketleme gerektirmeyen sıfırdan bir yaklaşım.
-
#16MultiActor-Audiobook: Yüzler ve Seslerle Sıfırdan ÜretimMultiActor-Audiobook'un, çok modlu konuşmacı kişilikleri ve LLM tabanlı senaryo talimatları kullanarak ifadeli sesli kitaplar üreten yeni bir sıfırdan sistemin teknik analizi.
Son güncelleme: 2026-01-12 05:31:34