Articles

Parametrische Sprachsynthese

Die Technologie der Sprachverarbeitung, die Sprachmodellierung, -synthese, -kodierung und -erkennung umfasst, geht auf die von Homer Dudley in den späten 1930er und frühen 1940er Jahren eingeführten parametrischen Verfahren zurück. Diese Methoden sind „parametrisch“ in dem Sinne, dass sie ein Modell der akustischen Eigenschaften des menschlichen Vokaltrakts konstruieren und dann die Sprache analysieren, indem sie die Werte der Parameter des Modells bestimmen. Nachfolgend ist eine Wiedergabe des Grundmodells aus Dudleys Arbeit von 1940, „The Carrier Nature of Speech“, veröffentlicht im The Bell System Technical Journal, zu sehen.

Dudley's vocal tract model

Auf der Weltausstellung 1939 in New York demonstrierten die Bell Labs dieses Prinzip mit einem Gerät namens „Voder“, das unten in Aktion zu sehen ist.

Voder being demonstrated

Der Voder wird von hochqualifizierten Technikern (die damals „Mädchen“ genannt wurden) bedient. Ein Techniker bediente eine Reihe analoger (kontinuierlicher) Steuerelemente, die sprachähnliche Laute erzeugten, wie in dem Satz „Ich grüße euch alle“:

Wenn Sie in der Lage wären, Applets auszuführen, gäbe es hier eines.

Der Voder wurde sorgfältig entworfen, um die Einschränkungen des menschlichen Bedieners mit den Anforderungen an die Sprachmodellierung in Einklang zu bringen. Er ist im folgenden Schema dargestellt:

Voder schematic
Zehn „Spektrumtasten“ steuern die Verstärkungen von zehn Bandpassfiltern (weil es zehn Finger gibt), wodurch der spektrale Inhalt des Sprachsignals grob bestimmt wird (man beachte, dass ein normaler menschlicher Bediener nur höchstens zehn Tasten auf einmal steuern kann).Eine Handgelenksleiste schaltet zwischen einer periodischen Anregung („summende Energie“) und einer Anregung mit weißem Rauschen („zischende Energie“) um.Die periodische Erregung wird verwendet, um stimmhafte Klänge (wie „aaaaa“) zu erzeugen, während die Erregung mit weißem Rauschen verwendet wird, um stimmlose Klänge (wie „sssss“) zu erzeugen.

Hören Sie sich die vollständige Voder-Demonstration an:

Wenn Sie in der Lage wären, Applets auszuführen, würde es hier eines geben.