Una voz generada artificialmente por un sistema informático, en lugar de ser grabada por una persona real. Esta tecnología convierte texto escrito en habla audible, mediante procesos conocidos como síntesis de voz o text-to-speech.

Tecnologías comunes

  • síntesis concatenativa: usa fragmentos de voz humana grabada y los ensambla
  • síntesis paramétrica: usa modelos estadísticos para generar la voz
  • redes neuronales artificiales (como WaveNet o Tacotron): imitan con alta fidelidad la entonación y naturalidad de una voz humana