Subtitle Edit: Wenn Untertitel plötzlich ganz einfach werden
Fit für die Kulturhauptstadt: Warum Unternehmen in Chemnitz jetzt auf Englischkurse setzen
Eleven Labs: Wie KI-Sprachtechnologie die Arbeit von Sprachprofis verändert
KI kann inzwischen Texte schreiben, Bilder malen – und ja, auch sprechen. Als Sprachdienstleister steht die SprachUnion genau an der Schnittstelle zwischen Mensch und Maschine. Wir beobachten die Entwicklungen mit Spannung, testen laufend neue Tools und finden heraus, wo sie wirklich sinnvoll eingesetzt werden können. Eines dieser Tools ist Eleven Labs, ein KI-gestütztes Text to Speech Programm, das auf den ersten Blick ziemlich beeindruckend klingt – im wahrsten Sinne des Wortes.
Technisch stark, menschlich noch limitiert
Denn was Eleven Labs kann, ist nicht gerade wenig: Text in Sprache umwandeln – und das in 32 Sprachen mit über 100 Stimmen. Die erzeugten Audios klingen oft erstaunlich menschlich, emotional, ja sogar lebendig. Dazu gibt’s Features wie Transkription, Dubbing, Stimmen-Klonen oder die Vorlese-App „ElevenReader“. Für ein Tool, das auf Deep Learning basiert, ist das technisch gesehen ziemlich stark. Trotzdem: Auch wenn die Maschine mittlerweile flüssig spricht, merkt man an vielen Stellen, dass sie nicht immer genau versteht, was sie da sagt. Und spätestens bei feinen Betonungen oder kulturell anspruchsvollen Übersetzungen wird klar – ganz ohne menschliches Feingefühl geht es (noch) nicht.
KI kann viel – aber nicht alles
Hier kommen wir ins Spiel. Die SprachUnion kennt sich mit Sprache eben nicht nur technisch, sondern inhaltlich aus. Und das macht einen Unterschied. Gerade bei Voice-Over-Projekten, wie zum Beispiel für die Stadt Chemnitz, sorgt unsere menschliche Kontrolle dafür, dass aus guter KI-Arbeit am Ende auch wirklich überzeugende Inhalte werden. Denn so clever Tools wie Eleven Labs auch sind: Ausspracheprobleme, zu glatte Stimmen und inkonsistente Ergebnisse zeigen, dass maschinelle Sprachverarbeitung noch nicht alles abdeckt, was professionell klingt.
Gute Resultate brauchen mehr als nur Software
Als Video Übersetzer ist Eleven Labs also durchaus ein Gewinn, wenn man weiß, wie man damit umgeht. Und genau darin liegt unser Vorteil: Wir kombinieren Technologie mit Sprachkompetenz. Nicht als Selbstzweck, sondern um in einer KI-geprägten Welt verständlich zu bleiben – für alle, die zuhören.
Mehr zu unserer Arbeit mit KI und echten Stimmen gibt es hier.