-
#1Avaliação da Visão de Mundo de Modelos de Linguagem para Geração de FicçãoAnálise da capacidade de LLMs em manter mundos ficcionais consistentes, revelando limitações na coerência narrativa e retenção de estado para escrita criativa.
-
#2audio-novel - Documentação Técnica e RecursosDocumentação técnica abrangente e recursos sobre a tecnologia e aplicações de audio-novel.
-
#3Recuperação de Áudio Transmodal com Consultas em Linguagem NaturalInvestigação sobre recuperação de áudio usando consultas em linguagem natural livre, introduzindo novos benchmarks e linhas de base para recuperação transmodal de áudio.
-
#4Conceptualizando a Experiência do Audiobook: Um Enquadramento TeóricoUma análise do enquadramento teórico para conceptualizar diferenças entre ler livros impressos e ouvir audiobooks, enfatizando práticas de escuta móvel.
-
#5AudioBoost: Aprimorando a Descoberta de Audiolivros na Pesquisa do Spotify via Consultas Sintéticas Geradas por LLMAnálise do AudioBoost, um sistema que usa LLMs para gerar consultas sintéticas a partir de metadados de audiolivros, melhorando a recuperação e sugestões de pesquisa no cenário de arranque a frio do Spotify.
-
#6AudioBoost: Melhorando a Descoberta de Audiolivros na Pesquisa do Spotify via Consultas Sintéticas Geradas por LLMAnálise do AudioBoost, um sistema que usa Modelos de Linguagem de Grande Porte para gerar consultas sintéticas e melhorar a recuperabilidade de audiolivros no motor de busca do Spotify em cenários de arranque a frio.
-
#7Audiobook-CC: Uma Estrutura para Geração Controlada de Audiobooks Multicast de Longo ContextoAnálise do Audiobook-CC, uma nova estrutura de síntese de fala para gerar audiobooks multicast coerentes e expressivos emocionalmente, com controle refinado e modelagem de longo contexto.
-
#8Audiobook-CC: Uma Estrutura para Geração Controlada de Audiobooks Multicast de Longo ContextoAnálise do Audiobook-CC, uma nova estrutura TTS para gerar audiobooks multicast coerentes, expressivos emocionalmente e contextualmente consistentes com controle refinado.
-
#9Análise de 'Audiolivros Digitais: Novas Mídias, Utilizadores e Experiências' - Uma Perspetiva dos Estudos de MídiaUma análise crítica da recensão do livro 'Audiolivros Digitais', explorando a teoria da midiatização, a pós-fenomenologia e a evolução do consumo de literatura em formato áudio.
-
#10Tradução Automática de Fala de Ponta a Ponta em Audiolivros: Corpus, Modelos e AnáliseAnálise de modelos de tradução de fala para texto de ponta a ponta num corpus de audiolivros aumentado, explorando cenários de treino e eficiência do modelo.
-
#11Música e Níveis de Narração no Cinema: Uma Análise NarratológicaUma análise aprofundada da música cinematográfica através da lente da narratologia, explorando como a música funciona em diferentes níveis narrativos no cinema.
-
#12Recomendações Personalizadas de Audiobooks na Spotify Através de Redes Neurais em GrafosSistema inovador 2T-HGNN da Spotify combina Redes Neurais em Grafos Heterogêneos e modelos Two Tower para recomendações escaláveis de audiobooks, alcançando +46% na taxa de início.
-
#13J-MAC: Corpus de Audiobook Japonês Multi-Locutor para Síntese de VozAnálise da metodologia de construção do corpus J-MAC, contribuições técnicas, resultados de avaliação e direções futuras para síntese de voz expressiva em audiobooks.
-
#14MAMLCon: Meta-Aprendizagem para Classificação Contínua de Palavras Faladas com Poucos ExemplosUma nova abordagem de meta-aprendizagem (MAMLCon) que mitiga o esquecimento catastrófico na aprendizagem contínua com poucos exemplos para classificação de palavras faladas, superando métodos existentes como o OML.
-
#15Audiolivros Móveis para Compreensão Auditiva em ILE: Um Enquadramento para Estudantes UniversitáriosAnálise e enquadramento para integrar Audiolivros Móveis (MABs) no desenvolvimento de competências de compreensão auditiva em estudantes universitários de ILE, abrangendo vantagens, seleção, implementação e avaliação.
-
#16Audiolivros Móveis para Compreensão Auditiva em ILE: Um Quadro para Estudantes UniversitáriosAnálise e quadro para integrar audiolivros móveis no desenvolvimento da compreensão auditiva de estudantes universitários de ILE, abrangendo vantagens, seleção, implementação e avaliação.
-
#17Movie101v2: Um Benchmark Aprimorado para Geração Automática de Narração CinematográficaAnálise do Movie101v2, um conjunto de dados bilíngue de grande escala para narração de filmes, incluindo seu roteiro de tarefas em três estágios, avaliações de linha de base e direções futuras de pesquisa.
-
#18Efeito da Música e das Letras no Reconhecimento da Fala: Análise e ImplicaçõesAnálise de investigação sobre como a música de fundo, com e sem letra, impacta o reconhecimento da fala, com implicações para contextos sociais e trabalhos futuros.
-
#19WonderFlow: Design Centrado na Narração para Vídeos de Dados AnimadosUma ferramenta de autoria interativa que simplifica a criação de vídeos de dados animados, ligando a narração às animações dos gráficos e fornecendo efeitos de animação conscientes da estrutura.
-
#20Geração de Narração para Vídeos de Desenho Animado: Formalização da Tarefa, Conjunto de Dados e ModelosUm artigo de pesquisa que introduz a tarefa de geração automática de narração para vídeos, apresenta um novo conjunto de dados da Peppa Pig e propõe modelos para temporização e geração de conteúdo.
-
#21Um Modelo Fonético do Processamento de Palavras Faladas por Não Nativos: Análise e PerspetivasAnálise de um modelo computacional que explora o papel da perceção fonética no processamento de palavras por não nativos, desafiando explicações fonológicas tradicionais.
-
#22Incorporação Fonética e Semântica de Palavras Faladas com Aplicações na Recuperação de Conteúdo FaladoUma estrutura de duas etapas para incorporar palavras faladas com informação fonética e semântica, permitindo uma recuperação avançada de documentos falados que vai além da simples correspondência de termos.
-
#23Análise de Prosódia em Audiolivros: Modelos de PLN para Síntese de Voz AprimoradaInvestigação sobre a previsão de atributos de prosódia (tom, volume, ritmo) em textos narrativos usando PLN e modelos de linguagem, melhorando a síntese de voz para geração de audiolivros.
-
#24Classificação de Narradores Não Confiáveis com Modelos de Linguagem de Grande PorteInvestigação sobre identificação computacional de narradores não confiáveis usando LLMs, apresentando o conjunto de dados TUN A e classificação de não confiabilidade intra-narrativa, inter-narrativa e intertextual.
-
#25Detecção de Ações com Supervisão Fraca Orientada por Narração de ÁudioUm artigo de pesquisa que explora como usar narração de áudio ruidosa como supervisão fraca para treinar modelos de detecção de ações, reduzindo custos de anotação e aproveitando características multimodais de vídeo.
-
#26MultiActor-Audiobook: Geração Zero-Shot com Múltiplos LocutoresUma abordagem zero-shot para gerar audiolivros expressivos usando personas multimodais e instruções de script baseadas em LLM, eliminando treinamento dispendioso e anotação manual.
-
#27MultiActor-Audiobook: Geração Zero-Shot com Rostos e VozesAnálise técnica do MultiActor-Audiobook, um sistema zero-shot inovador para gerar audiolivros expressivos usando personas multimodais e instruções de roteiro baseadas em LLM.
Última atualização: 2026-02-25 12:01:15