Parametrikus beszédszintézis
A beszédfeldolgozás technológiája, amely magában foglalja a beszéd modellezését, szintézisét, kódolását és felismerését, a Homer Dudley által az 1930-as évek végén és az 1940-es évek elején bevezetett parametrikus technikákra vezethető vissza. Ezek a módszerek abban az értelemben “parametrikusak”, hogy felépítik az emberi hangszalag akusztikai tulajdonságainak modelljét, majd a beszédet a modell paramétereinek értékeinek meghatározásával elemzik. Az alábbiakban a Dudley 1940-es, “The Carrier Nature of Speech” című, a The Bell System Technical Journalban megjelent “The Carrier Nature of Speech” című tanulmányából származó alapmodell ábrázolása látható.
Az 1939-es New York-i világkiállításon a Bell Labs bemutatta ezt az elvet a “Voder” nevű eszközzel, amely alább látható működés közben.
A vodert magasan képzett technikusok (akiket akkoriban “lányoknak” hívtak) kezelték. Egy technikus egy sor analóg (folyamatos) vezérlőt manipulált, amelyek beszédszerű hangokat állítottak elő, mint az “Üdvözlet mindenkinek” mondatban:
A vodert gondosan úgy tervezték, hogy az emberi kezelő korlátait a beszéd modellezésének igényeihez igazítsa. A következő séma mutatja:
Hallgassa meg a teljes Voder bemutatót: