Parametryczna synteza mowy
Technologia przetwarzania mowy, która obejmuje modelowanie, syntezę, kodowanie i rozpoznawanie mowy, wywodzi się z technik parametrycznych wprowadzonych przez Homera Dudleya w późnych latach trzydziestych i wczesnych czterdziestych XX wieku. Metody te są „parametryczne” w tym sensie, że budują model właściwości akustycznych ludzkiego traktu głosowego, a następnie analizują mowę poprzez określenie wartości parametrów tego modelu. Poniżej przedstawiono podstawowy model z pracy Dudley’a z 1940 roku, zatytułowanej „The Carrier Nature of Speech”, opublikowanej w The Bell System Technical Journal.
Na Targach Światowych w Nowym Jorku w 1939 roku Bell Labs zademonstrowało tę zasadę za pomocą urządzenia zwanego „Voder”, pokazanego poniżej w działaniu.
Voder jest obsługiwany przez wysoko wykwalifikowanych techników (którzy w tamtych czasach byli nazywani „dziewczynami”). Technik manipulował zestawem analogowych (ciągłych) kontrolek, które wytwarzały dźwięki przypominające mowę, jak w zdaniu „witam wszystkich”:
Woder jest starannie zaprojektowany, aby dopasować ograniczenia ludzkiego operatora do potrzeb modelowania mowy. Jest to pokazane na poniższym schemacie:
Posłuchaj kompletnej demonstracji Vodera: