Parametrische spraaksynthese
De technologie van de spraakverwerking, die spraakmodellering, -synthese, -codering en -herkenning omvat, gaat terug tot de parametrische technieken die eind jaren dertig, begin jaren veertig door Homer Dudley werden geïntroduceerd. Deze methoden zijn “parametrisch” in die zin dat zij een model construeren van de akoestische eigenschappen van het menselijk spraakkanaal, en vervolgens de spraak analyseren door de waarden van de parameters van het model te bepalen. Hieronder staat een weergave van het basismodel uit Dudley’s artikel uit 1940, “The Carrier Nature of Speech,” gepubliceerd in The Bell System Technical Journal.
Op de Wereldtentoonstelling van 1939 in New York demonstreerde Bell Labs dit principe met een apparaat dat de “Voder” werd genoemd en dat hieronder in actie te zien is.
De voder wordt bediend door hoogopgeleide technici (die in die tijd “meisjes” werden genoemd). Een technicus manipuleerde een reeks analoge (continue) regelaars die spraakgeluiden produceerden, zoals in de zin “groet iedereen”:
De voder is zorgvuldig ontworpen om de beperkingen van de menselijke bediener af te stemmen op de behoeften voor het modelleren van spraak. Het is weergegeven in het volgende schema:
Luister naar de volledige Voder demonstratie: