Articles

Parametrikus beszédszintézis

A beszédfeldolgozás technológiája, amely magában foglalja a beszéd modellezését, szintézisét, kódolását és felismerését, a Homer Dudley által az 1930-as évek végén és az 1940-es évek elején bevezetett parametrikus technikákra vezethető vissza. Ezek a módszerek abban az értelemben “parametrikusak”, hogy felépítik az emberi hangszalag akusztikai tulajdonságainak modelljét, majd a beszédet a modell paramétereinek értékeinek meghatározásával elemzik. Az alábbiakban a Dudley 1940-es, “The Carrier Nature of Speech” című, a The Bell System Technical Journalban megjelent “The Carrier Nature of Speech” című tanulmányából származó alapmodell ábrázolása látható.

Dudley's vocal tract model

Az 1939-es New York-i világkiállításon a Bell Labs bemutatta ezt az elvet a “Voder” nevű eszközzel, amely alább látható működés közben.

Voder being demonstrated

A vodert magasan képzett technikusok (akiket akkoriban “lányoknak” hívtak) kezelték. Egy technikus egy sor analóg (folyamatos) vezérlőt manipulált, amelyek beszédszerű hangokat állítottak elő, mint az “Üdvözlet mindenkinek” mondatban:

Ha képesek lennének appleteket futtatni, akkor itt lenne egy.

A vodert gondosan úgy tervezték, hogy az emberi kezelő korlátait a beszéd modellezésének igényeihez igazítsa. A következő séma mutatja:

Voder schematic
Tíz “spektrumgomb” szabályozza tíz sávszűrő erősítését (mivel tíz ujj van).Ez durván meghatározza a beszédjel spektrális tartalmát (vegye figyelembe, hogy egy normális emberi kezelő egyszerre csak legfeljebb tíz gombot tud irányítani).Egy csuklósáv váltogatja a periodikus gerjesztést (“zúgás típusú energia”) és a fehér zaj gerjesztést (“sziszegés típusú energia”).A periodikus gerjesztést hangos hangok (például “aaaaaaa”), míg a fehérzaj gerjesztést hangtalan hangok (például “sssss”) előállítására használják.Egy lábpedál szabályozza a periodikus gerjesztés frekvenciáját, amely ezáltal szabályozhatja a hanglejtést.

Hallgassa meg a teljes Voder bemutatót:

Ha tudna appleteket futtatni, akkor itt lenne egy.