-
#1Narración Colaborativa con Actores Humanos y Narradores de IA: Análisis de un Informe de EventoAnálisis del uso de GPT-3 como co-narrador en teatro de improvisación en vivo. Cubre metodología, retroalimentación del público/actores e implicaciones para la colaboración creativa humano-IA.
-
#2Evaluación de la Visión del Mundo de los Modelos de Lenguaje para la Generación de FicciónAnálisis de la capacidad de los LLM para mantener mundos ficticios consistentes, revelando limitaciones en la coherencia narrativa y la retención de estado para la escritura creativa.
-
#3audio-novel - Documentación Técnica y RecursosDocumentación técnica completa y recursos sobre la tecnología y aplicaciones de audio-novel.
-
#4Recuperación de Audio Multimodal con Consultas en Lenguaje NaturalInvestigación sobre recuperación de audio usando consultas de lenguaje natural libre, introduciendo nuevos benchmarks y líneas base para recuperación multimodal de audio.
-
#5Conceptualizando la Experiencia del Audiolibro: Un Marco TeóricoAnálisis del marco teórico para conceptualizar las diferencias entre leer libros impresos y escuchar audiolibros, enfatizando las prácticas de escucha móvil.
-
#6AudioBoost: Mejora del Descubrimiento de Audiolibros en la Búsqueda de Spotify mediante Consultas Sintéticas Generadas por LLMAnálisis de AudioBoost, un sistema que utiliza LLM para generar consultas sintéticas a partir de metadatos de audiolibros, mejorando la recuperación y sugerencias de búsqueda en el escenario de arranque en frío de Spotify.
-
#7AudioBoost: Mejora del Descubrimiento de Audiolibros en la Búsqueda de Spotify mediante Consultas Sintéticas Generadas por LLMAnálisis de AudioBoost, un sistema que utiliza Modelos de Lenguaje Grande para generar consultas sintéticas y mejorar la recuperabilidad de audiolibros en el motor de búsqueda de Spotify en escenarios de arranque en frío.
-
#8Audiobook-CC: Un Marco para la Generación Controlable de Audiolibros Multicast de Contexto LargoAnálisis de Audiobook-CC, un novedoso marco de síntesis de voz para generar audiolibros multicast coherentes y expresivos, con control detallado y modelado de contexto largo.
-
#9Audiobook-CC: Un Marco de Trabajo para la Generación Controlable de Audiolibros Multicast de Contexto LargoAnálisis de Audiobook-CC, un novedoso marco de trabajo TTS para generar audiolibros multicast coherentes, expresivos emocionalmente y consistentes en contexto, con control de grano fino.
-
#10Análisis de 'Audiolibros digitales: Nuevos medios, usuarios y experiencias' - Una perspectiva de los estudios mediáticosUn análisis crítico de la reseña del libro 'Audiolibros digitales', explorando la teoría de la mediatización, la post-fenomenología y la evolución del consumo de literatura en formato audio.
-
#11Traducción Automática de Extremo a Extremo de Audiolibros: Corpus, Modelos y AnálisisAnálisis de modelos de traducción de voz a texto de extremo a extremo en un corpus de audiolibros aumentado, explorando escenarios de entrenamiento y eficiencia del modelo.
-
#12Música y Niveles de Narración en el Cine: Un Análisis NarratológicoUn análisis en profundidad de la música cinematográfica desde la perspectiva de la narratología, explorando cómo funciona la música en los diferentes niveles narrativos del cine.
-
#13Recomendaciones Personalizadas de Audiolibros en Spotify Mediante Redes Neuronales de GrafosEl innovador sistema 2T-HGNN de Spotify combina Redes Neuronales de Grafos Heterogéneos y modelos Two Tower para recomendaciones escalables de audiolibros, logrando un aumento del +46% en la tasa de inicio.
-
#14J-MAC: Corpus de Audiolibros Multihablante Japonés para Síntesis de VozAnálisis de la metodología de construcción del corpus J-MAC, contribuciones técnicas, resultados de evaluación y direcciones futuras para la síntesis expresiva de voz en audiolibros.
-
#15MAMLCon: Metaaprendizaje para la Clasificación Continua de Palabras Habladas con Pocos EjemplosUn novedoso enfoque de metaaprendizaje (MAMLCon) que mitiga el olvido catastrófico en el aprendizaje continuo con pocos ejemplos para la clasificación de palabras habladas, superando a métodos existentes como OML.
-
#16Audiolibros Móviles para la Comprensión Auditiva en ILE: Un Marco para Estudiantes UniversitariosAnálisis y marco para integrar Audiolibros Móviles (MABs) en el desarrollo de la comprensión auditiva en estudiantes universitarios de ILE, cubriendo ventajas, selección, implementación y evaluación.
-
#17Audiolibros Móviles para la Comprensión Auditiva en ILE: Un Marco para Estudiantes UniversitariosAnálisis y marco para integrar audiolibros móviles y desarrollar habilidades de comprensión auditiva en estudiantes universitarios de inglés como lengua extranjera (ILE), cubriendo ventajas, selección, implementación y evaluación.
-
#18Movie101v2: Un Punto de Referencia Mejorado para la Generación Automática de Narración CinematográficaAnálisis de Movie101v2, un conjunto de datos bilingüe a gran escala para narración cinematográfica, incluyendo su hoja de ruta de tres etapas, evaluaciones de referencia y direcciones futuras de investigación.
-
#19Efecto de la Música y la Letra en el Reconocimiento de Palabras Habladas: Análisis e ImplicacionesAnálisis de cómo la música de fondo, con y sin letra, afecta el reconocimiento del habla, con implicaciones para entornos sociales y trabajo futuro.
-
#20WonderFlow: Diseño Centrado en la Narración para Vídeos de Datos AnimadosUna herramienta de autoría interactiva que simplifica la creación de vídeos de datos animados vinculando la narración a las animaciones de gráficos y proporcionando efectos de animación conscientes de la estructura.
-
#21Generación de Narración para Videos de Dibujos Animados: Formalización de la Tarea, Conjunto de Datos y ModelosUn artículo de investigación que presenta la tarea de generación automática de narración para videos, un nuevo conjunto de datos de Peppa Pig y modelos para la sincronización y generación de contenido.
-
#22Un Modelo Fonético del Procesamiento Léxico Oral No Nativo: Análisis y PerspectivasAnálisis de un modelo computacional que explora el papel de la percepción fonética en el procesamiento de palabras no nativas, desafiando las explicaciones fonológicas tradicionales.
-
#23Análisis de Prosodia en Audiolibros: Modelos de PLN para una Síntesis de Voz MejoradaInvestigación sobre la predicción de atributos prosódicos (tono, volumen, ritmo) en textos narrativos mediante PLN y modelos de lenguaje, mejorando la síntesis de voz para la generación de audiolibros.
-
#24Clasificación de Narradores No Fiables con Modelos de Lenguaje a Gran EscalaInvestigación sobre identificación computacional de narradores no fiables usando LLMs, presentando el dataset TUN A y clasificación de no fiabilidad intranarrativa, internarrativa e intertextual.
-
#25Detección de Acciones Débilmente Supervisada Guiada por Narración de AudioUn artículo de investigación que explora cómo usar la narración de audio ruidosa como supervisión débil para entrenar modelos de detección de acciones, reduciendo costos de anotación y aprovechando características multimodales del video.
-
#26MultiActor-Audiobook: Generación con Múltiples Locutores sin Entrenamiento PrevioUn enfoque sin entrenamiento previo para generar audiolibros expresivos usando personajes multimodales e instrucciones de guion basadas en LLM, eliminando costosas anotaciones manuales.
-
#27MultiActor-Audiobook: Generación Zero-Shot con Rostros y VocesAnálisis técnico de MultiActor-Audiobook, un novedoso sistema zero-shot para generar audiolibros expresivos utilizando personas de hablantes multimodales e instrucciones de guion basadas en LLM.
Última actualización: 2026-02-25 12:01:14