Ihr Browser ist veraltet. Bitte aktualisieren Sie Ihren Browser auf die neueste Version, oder wechseln Sie auf einen anderen Browser wie ChromeSafariFirefox oder Edge um Sicherheitslücken zu vermeiden und eine bestmögliche Performance zu gewährleisten.

Zum Hauptinhalt springen

Mark Zuckerbergs Babelfisch
Meta stellt KI-Modell vor, das Text und Gesprochenes simultan übersetzen kann

Junge Frau mit Kopfhörern unterrichtet online, sitzt in einem hellen Raum mit Regalen im Hintergrund.
Jetzt abonnieren und von der Vorlesefunktion profitieren.
BotTalk
In Kürze:
  • Ein Team um KI-Forscherin Marta Costa-jussà hat ein KI-Modell entwickelt, das gesprochenen Text offenbar besser als je zuvor übersetzt und wieder als Sprache ausgibt.
  • Das Modell heisst SeamlessM4T, erkennt 101 Sprachen und kann sie in 36 Sprachen übersetzen.
  • Die Forschenden wollen die Technik öffentlich und für nicht kommerzielle Zwecke zugänglich zu machen.

Bei all der Technik, die angeblich Menschen voneinander entfernt, weil sie sich im Restaurant gegenübersitzen, aber doch nur auf ihr Handy starren; so könnte doch auch Technik dazu führen, dass Menschen sich in Zukunft besser verstehen als je zuvor. Schon lange träumen Menschen von einem geheimen Helferlein im Ohr, das das gesprochene Wort des Gegenübers fehlerfrei in Echtzeit übersetzt – einem Babelfisch, wie er in Douglas Adams’ Bestseller-Reihe «Per Anhalter durch die Galaxis» vorkommt. Wie wäre es nur, könnte man damit eines Tages per Anhalter durch die Galaxis reisen? Na gut, oder wenigstens mit allen Menschen auf dem Planeten sprechen, die man sonst, weil eine gemeinsame Sprache fehlt, bisher nicht verstanden hat?

Der Traum vom Dolmetscher im Ohr rückt dank Meta näher

Forschende sind diesem Ziel nun einen mächtigen Schritt näher gekommen, wie sie in einer aktuellen Studie im Fachmagazin «Nature» beschreiben. Der Traum, mit Kopfhörern im Ohr und aktiver Übersetzungsapp auf dem Handy eine Unterhaltung zu führen, rückt näher an die Gegenwart. Ein Team um KI-Forscherin Marta Costa-jussà, angestellt beim Techgiganten Meta, stellt in der aktuellen Studie ein KI-Modell vor, das gesprochenen Text offenbar besser als je zuvor übersetzt und wieder als Sprache ausgibt. Das in der Studie beschriebene Modell mit dem Namen SeamlessM4T übertreffe die Leistung bestehender Systeme.

«Obwohl es konventionelle Sprache-zu-Sprache-Übersetzungssysteme gibt, (…) sind skalierbare und leistungsstarke einheitliche Systeme noch wenig erforscht», schreiben die Autoren. SeamlessM4T kann bis zu 101 Sprachen erkennen und in 36 Sprachen übersetzen. Die Genauigkeit geben die Forschenden mit bis zu 23 Prozent höher an als bei vergleichbaren Systemen. Ausserdem soll es deutlich widerstandsfähiger gegen Hintergrundgeräusche und Sprechervariationen bei Sprach-zu-Text-Aufgaben sein.

Die meisten bestehenden maschinellen Lernübersetzungssysteme orientieren sich an einem Text. So muss gesprochenes Wort erkannt, in Text transkribiert, übersetzt und wieder zurück in Sprache gewandelt werden. Doch «ist Sprache kein gesprochener Text», so die Autoren. Sie bestehe vielmehr aus Komponenten wie Rhythmus, Betonung, Intonation und, ganz wichtig, Emotion. All das soll das neue Modell besser umsetzen.

Weiterhin «gesunden Menschenverstand» nutzen

Und tatsächlich: «Mit Seamless gelingen wichtige Schritte für die automatische multimodale Übersetzung, die nicht nur besser, sondern auch ‹natürlicher› klingt», sagt Barbara Plank, Professorin für AI und Computerlinguistik, die nicht an der Studie beteiligt war. «Trotzdem bleibt noch immer eine grosse Asymmetrie zwischen Sprachvielfalt und verfügbaren Daten», so Plank. Es gibt nun mal noch immer deutlich mehr geschriebenen Text, mit dessen Hilfe KI-Systeme trainieren können, als aufgenommene Sprache. Gerade die kleinen, nicht standardisierten Sprachen seien weiterhin für KI-Systeme eine Herausforderung, man denke nur an Dialekte, so Plank.

Und doch, die Menschheit ist auf dem Weg in Richtung Babelfisch im Ohr. Barbara Plank aber mahnt, weiterhin den «gesunden Menschenverstand» zu nutzen. Mit den immer besseren KI-Systemen müsse die Menschheit eben auch lernen, wann man sich auf automatische Übersetzung verlassen könne und wann nicht. «Ein vertrauenswürdiger Umgang Mensch-Maschine ist so wichtig», sagt Plank. Der Mensch müsse erkennen, wann die Maschine Fehler mache. Aber auch umgekehrt: KI-Systeme müssen lernen, wann sie selbst oder der Mensch einen Fehler macht. «Genau diese Kooperationen zwischen KI und Mensch sind Thematiken, die in Zukunft umso wichtiger werden», sagt Plank.

Die Studienautoren haben angekündigt, die Technik öffentlich und für nicht kommerzielle Zwecke zugänglich zu machen, um weitere Forschung zu integrativen Sprachübersetzungstechnologien zu unterstützen. Details dazu aber nennen sie nicht; eine Anfrage blieb bis Redaktionsschluss unbeantwortet.

Den KI-Übersetzer ausprobieren? https://seamless.metademolab.com/demo

Newsletter
Celsius
Erhalten Sie die wichtigsten Hintergründe und Analysen rund um Klima und Wetter.

Weitere Newsletter