Sprachsynthese

 

Mit Hilfe der Sprachsynthese können geschriebene Texte in Sprache umgesetzt werden. Man spricht daher von Text-to-Speech (TTS) Systemen. Beispielsweise kann man sich mit dieser Technologie eine Email vorlesen lassen, wenn man keinen Bildschirm zur Verfügung hat. Ein anderes Beispiel ist die sprachliche Wiedergabe eines Orts- oder Strassennamens in einem Navigationssystem.

Zur Sprachsynthese wird der geschriebene Text zunächst mit Hilfe eines Aussprachelexikons in eine Lautfolge transferiert. Für die einzelnen Laute werden dann aus den Sprachaufnahmen einer Person die passenden sprachlichen Abschnitte extrahiert und hintereinander gehangen. Dazu muss bei den Sprachaufnahmen eine lautsprachliche Segmentierung vorgenommen worden sein. Bei der Suche nach geeigneten sprachlichen Abschnitten betrachtet man nicht jeden Laut einzeln, sondern versucht, möglichst lange Lautsequenzen, die synthetisiert werden sollen, in den Sprachaufnahmen zu finden. Dabei werden beispielsweise häufig gebrauchte Wörter vermutlich komplett aus den Sprachaufnahmen entnommen werden. Je umfangreicher das aufgenommene Sprachmaterial ist, desto wahrscheinlicher ist es, möglichst lange Lautsequenzen bis hin zu ganzen Satzphrasen in den Sprachaufnahmen zu finden. Bei einem guten Text-to-Speech System wird abschließend noch eine Satzbetonung aufgebracht.


Nachstehend können Sie einen beliebigen deutschen oder englischen Text eingeben. Nach Drücken der START-Taste wird der Text mit Hilfe eines Text-to-Speech Systems der Firma Cepstral in Sprache umgesetzt. Das Sprachsignal können Sie sich anhören oder als File im WAV Format abspeichern.

(Hinweis: Bitte geben Sie die Umlaute ä,ö,ü als ae,oe bzw. ue und ß als ss ein! )

Deutsch
Englisch