Articles

Synthèse paramétrique de la parole

La technologie du traitement de la parole, qui comprend la modélisation, la synthèse, le codage et la reconnaissance de la parole, remonte aux techniques paramétriques introduites par Homer Dudley à la fin des années 1930 et au début des années 1940. Ces méthodes sont « paramétriques » dans le sens où elles construisent un modèle des propriétés acoustiques du conduit vocal humain, puis analysent la parole en déterminant les valeurs des paramètres du modèle. On trouvera ci-dessous un rendu du modèle de base tiré de l’article de Dudley de 1940, « The Carrier Nature of Speech », publié dans le Bell System Technical Journal.

Dudley's vocal tract model

À l’exposition universelle de 1939 à New York, les Bell Labs ont démontré ce principe avec un dispositif appelé « Voder », montré ci-dessous en action.

Voder being demonstrated

Le voder est actionné par des techniciens hautement qualifiés (qui à l’époque étaient appelés « filles »). Un technicien manipulait un ensemble de commandes analogiques (continues) qui produisaient des sons ressemblant à la parole, comme dans la phrase « salutations tout le monde »:

Si vous étiez capable d’exécuter des applets, il y en aurait une ici.

Le vodeur est soigneusement conçu pour faire correspondre les limitations de l’opérateur humain aux besoins de modélisation de la parole. Il est représenté dans le schéma suivant :

Voder schematic
Dix « touches de spectre » contrôlent les gains de dix filtres passe-bande (parce qu’il y a dix doigts).Cela détermine grossièrement le contenu spectral du signal de parole (notez qu’un opérateur humain normal ne peut contrôler que dix touches au maximum à la fois).Une barre de poignet permet de basculer entre une excitation périodique (« énergie de type bourdonnement ») et une excitation de bruit blanc (« énergie de type sifflement »).L’excitation périodique est utilisée pour produire des sons voisés (comme « aaaaa »)tandis que l’excitation à bruit blanc est utilisée pour produire des sons non voisés(comme « sssss »).Une pédale de commande contrôle la fréquence de l’excitation périodique, qui peut ainsi contrôler l’inflexion.

Écoutez la démonstration complète du Voder:

Si vous étiez capable d’exécuter des applets, il y en aurait une ici.