Articles

Parametrische spraaksynthese

De technologie van de spraakverwerking, die spraakmodellering, -synthese, -codering en -herkenning omvat, gaat terug tot de parametrische technieken die eind jaren dertig, begin jaren veertig door Homer Dudley werden geïntroduceerd. Deze methoden zijn “parametrisch” in die zin dat zij een model construeren van de akoestische eigenschappen van het menselijk spraakkanaal, en vervolgens de spraak analyseren door de waarden van de parameters van het model te bepalen. Hieronder staat een weergave van het basismodel uit Dudley’s artikel uit 1940, “The Carrier Nature of Speech,” gepubliceerd in The Bell System Technical Journal.

Dudley's vocal tract model

Op de Wereldtentoonstelling van 1939 in New York demonstreerde Bell Labs dit principe met een apparaat dat de “Voder” werd genoemd en dat hieronder in actie te zien is.

Voder being demonstrated

De voder wordt bediend door hoogopgeleide technici (die in die tijd “meisjes” werden genoemd). Een technicus manipuleerde een reeks analoge (continue) regelaars die spraakgeluiden produceerden, zoals in de zin “groet iedereen”:

Als je applets zou kunnen draaien, zou er hier een staan.

De voder is zorgvuldig ontworpen om de beperkingen van de menselijke bediener af te stemmen op de behoeften voor het modelleren van spraak. Het is weergegeven in het volgende schema:

Voder schematic
Tien “spectrumtoetsen” regelen de gains van tien bandpass-filters (omdat er tien vingers zijn). Dit bepaalt ruwweg de spectrale inhoud van het spraaksignaal (merk op dat een normale menselijke operator slechts maximaal tien toetsen tegelijk kan bedienen). Een polsbalk schakelt tussen een periodieke excitatie (“zoemtype energie”) en een excitatie met witte ruis (“sistype energie”).Periodieke excitatie wordt gebruikt om stemhebbende geluiden te produceren (zoals “aaaaa”), terwijl witte-ruis excitatie wordt gebruikt om ongestemde geluiden te produceren (zoals “sssss”).Een voetpedaal regelt de frequentie van de periodieke excitatie, die daardoor de buiging kan regelen.

Luister naar de volledige Voder demonstratie:

Als je applets zou kunnen draaien, zou er hier een zijn.