Sintesi vocale parametrica
La tecnologia dell’elaborazione del discorso, che include la modellazione, la sintesi, la codifica e il riconoscimento del discorso, risale alle tecniche parametriche introdotte da Homer Dudley alla fine degli anni ’30 e all’inizio degli anni ’40. Questi metodi sono “parametrici” nel senso che costruiscono un modello delle proprietà acustiche del tratto vocale umano e poi analizzano il discorso determinando i valori dei parametri del modello. Qui sotto c’è una rappresentazione del modello di base dell’articolo di Dudley del 1940, “The Carrier Nature of Speech”, pubblicato nel Bell System Technical Journal.
Al World’s Fair del 1939 a New York, i Bell Labs dimostrarono questo principio con un dispositivo chiamato “Voder”, mostrato qui sotto in azione.
Il voder è operato da tecnici altamente qualificati (che all’epoca erano chiamati “ragazze”). Un tecnico manipolava un insieme di controlli analogici (continui) che producevano suoni simili al parlato, come nella frase “saluti a tutti”:
Il voder è attentamente progettato per far corrispondere le limitazioni dell’operatore umano alle necessità di modellare il parlato. E’ mostrato nello schema seguente:
Ascolta la dimostrazione completa del Voder: