Una tecnología que convierte texto escrito en voz hablada mediante sistemas informáticos o inteligencia artificial. Su objetivo es permitir que una máquina “lea en voz alta” cualquier contenido textual.
Contenidos
mostrar
Cómo funciona
- entrada de texto: la usuaria proporciona un texto, como una frase, un documento o una palabra
- procesamiento lingüístico: el sistema analiza la estructura gramatical, los signos de puntuación y el contexto para interpretar cómo debe sonar el texto
- conversión fonética: convierte las palabras escritas en sonidos (fonemas)
- síntesis de audio: se genera una onda de sonido que representa la voz hablando ese texto
Tecnologías empleadas
- sistemas concatenativos: usan fragmentos grabados de voz humana ensamblados
- redes neuronales artificiales (como Tacotron, WaveNet o VITS): generan voces mucho más naturales usando redes profundas
Aplicaciones habituales
- asistentes virtuales (Alexa, Siri, Google Assistant)
- lectores para personas con discapacidad visual
- audiolibros generados automáticamente
- sistemas de navegación GPS
- bots de atención al cliente
Sinónimos:
texto a voz