Una tecnología que convierte texto escrito en voz hablada mediante sistemas informáticos o inteligencia artificial. Su objetivo es permitir que una máquina “lea en voz alta” cualquier contenido textual.

Cómo funciona

  1. entrada de texto: la usuaria proporciona un texto, como una frase, un documento o una palabra
  2. procesamiento lingüístico: el sistema analiza la estructura gramatical, los signos de puntuación y el contexto para interpretar cómo debe sonar el texto
  3. conversión fonética: convierte las palabras escritas en sonidos (fonemas)
  4. síntesis de audio: se genera una onda de sonido que representa la voz hablando ese texto

Tecnologías empleadas

  • sistemas concatenativos: usan fragmentos grabados de voz humana ensamblados
  • redes neuronales artificiales (como Tacotron, WaveNet o VITS): generan voces mucho más naturales usando redes profundas

Aplicaciones habituales

  • asistentes virtuales (Alexa, Siri, Google Assistant)
  • lectores para personas con discapacidad visual
  • audiolibros generados automáticamente
  • sistemas de navegación GPS
  • bots de atención al cliente
Sinónimos:
texto a voz