Ihr Browser ist veraltet. Bitte aktualisieren Sie Ihren Browser auf die neueste Version, oder wechseln Sie auf einen anderen Browser wie ChromeSafariFirefox oder Edge um Sicherheitslücken zu vermeiden und eine bestmögliche Performance zu gewährleisten.

Zum Hauptinhalt springen

Airpods, Youtube, Spotify
Wie die KI Sprachbarrieren einreissen wird

Weibliche Touristin hält ein Handy für ihre Reiseleiterin, um während einer Stadttour zu übersetzen.
Jetzt abonnieren und von der Vorlesefunktion profitieren.
BotTalk
In Kürze:
  • Gadgets sind auf dem Vormarsch, die Gespräche in Echtzeit übersetzen können.
  • Apple will die Airpods-Kopfhörer mit einer Funktion zum Dolmetschen ausstatten.
  • Youtube fügt bei Videos KI-Synchronisationen hinzu, und Spotify und Audible experimentieren mit Übersetzungen von Podcasts und Hörbüchern.
  • Kritiker befürchten eine kulturelle Verarmung durch noch mehr KI-Inhalte.

Ist der Vergleich mit der Bibel zu hoch gegriffen? Im Alten Testament strafte Gott die Menschheit für ihr anmassendes Turmbauprojekt mit der babylonischen Sprachverwirrung. Die Techkonzerne setzen dazu an, die Folgen jener Strafe aus der Welt zu schaffen. Mit der künstlichen Intelligenz (KI) soll die universelle Verständigung Einzug halten.

Gespräche in Echtzeit übersetzen

Brauchbare Textübersetzungen wie die von Deepl waren erst der Anfang. Bloomberg berichtete letzte Woche, Apple werde seinen Airpods-Pro-Kopfhörern beibringen, in Echtzeit zu dolmetschen. Das soll wie folgt funktionieren: Der Träger der Kopfhörer, der nur Englisch versteht, hört die Übersetzung einer Auskunft in Spanisch in seinen Ohrstöpseln. Wenn er eine Antwort gibt, wird die vom iPhone in Spanisch wiedergegeben.

Solche KI-Dolmetscher sind nicht neu. Bei den Pixel Buds Pro stellt Google diese Funktion seit Jahren zur Verfügung. Meta produziert in Zusammenarbeit mit Ray-Ban eine smarte Brille, die seit Ende 2024 zwischen den Sprachen vermittelt. Die Einsatzmöglichkeiten seien eingeschränkt, hielt die Testerin des Techmagazins «The Verge» fest: An Douglas Adams’ Babelfisch reiche das Gadget nicht heran. Im Science-Fiction-Roman «Per Anhalter durch die Galaxis» kriecht dieses Wesen ins Ohr des Users und vermittelt den Sinngehalt direkt in dessen Hirn.

Camilla, Herzogin von Cornwall, probiert in den neuen Meta-Büros in London eine Brille mit Video- und Bildfunktion von Ray-Ban an.

Nicht perfekt – aber für den Alltag doch gut genug? Konversationen mit den Chatbots sind noch holperig, doch die künstliche Intelligenz macht bei der gesprochenen Sprache rasante Fortschritte. Und die Techkonzerne hoffen darauf, dass viele Nutzerinnen und Nutzer über Unzulänglichkeiten hinwegsehen. Weil eine lückenhafte Verständigung besser ist als gar keine.

Automatische Synchronisation für Videos auf Youtube

Das ist auch die Prämisse bei Youtube. Die Videoplattform weitet derzeit die automatischen Synchronisationen aus. Bei diversen Kanälen wird die Tonspur der Videos in andere Sprachen übertragen. Das kommt nicht bei allen gut an: Kritiker meckern, weil sich die Synchronisation nicht permanent abschalten lässt. Aber vor allem stören sie sich am Sprachgenerator: «Die Stimme klingt wie aus dem Blecheimer», bemängelt der Journalist der Techplattform «Heise».

Hier wird Inhalt angezeigt, der zusätzliche Cookies setzt.

An dieser Stelle finden Sie einen ergänzenden externen Inhalt. Falls Sie damit einverstanden sind, dass Cookies von externen Anbietern gesetzt und dadurch personenbezogene Daten an externe Anbieter übermittelt werden, können Sie alle Cookies zulassen und externe Inhalte direkt anzeigen.

Es klafft eine riesige Kluft zwischen Original und KI-Tonspur. Während in einem Beispielclip der französischsprachige Koch charmant durch die Zubereitung seines Gratins dauphinois führt, wirkt er in der US-amerikanischen Übersetzung schnodderig. Das ist indes ein Youtube-spezifisches Manko: Die KI von Heygen sorgte vor zwei Jahren für Verblüffung, weil sie nicht nur die Stimmen der Sprecherinnen und Sprecher treffend imitiert, sondern auch die Lippenbewegungen an die Übersetzung anpasst. Youtube muss qualitativ noch stark zulegen.

Podcasts und Hörbücher ohne Sprachbarrieren

Die Sprachbarrieren fallen auch anderswo. Spotify experimentiert seit Sommer 2023 an der KI-Übersetzung von Podcasts. Derweil sondiert Audible, wie die Kundschaft auf automatisch übertragene und per KI eingesprochene Hörbücher reagieren würde. Vor allem in kleinen Sprachräumen könnte die KI das Angebot an medialen Inhalten mittelfristig massiv vergrössern.

Doch nicht allen ist wohl mit dieser Aussicht. Gerade bei den Hörbuchfans gibt es grosse Vorbehalte. Nicht zu Unrecht. Nach dem jetzigen Stand der Dinge sind nur menschliche Übersetzer und Sprecherinnen in der Lage, Sprache, Tonalität, Stimmung des Originals zu bewahren und in einen anderen Kulturkreis zu übertragen.

Löst Youtube ein echtes Problem? Auf der Videoplattform herrscht schon heute kein Mangel an Inhalten. Eine weitere Vergrösserung des Angebots verschärft den Kampf um Aufmerksamkeit noch mehr. Es besteht natürlich die Hoffnung, dass automatisch übersetzt auch Inhalte aus kleinen Sprachräumen wie der Schweiz Chancen auf ein globales Publikum haben. Doch genauso gut kann es passieren, dass die internationalen Stars ihre Reichweite auf Kosten der kleinen Märkte noch vergrössern.

Wie auch immer dieser Umbruch ausgeht: Die oft eintönig klingende KI zeigt, dass die babylonische Sprachenvielfalt keine Strafe und kein reines Kommunikationshindernis ist. Sie ist eine kulturelle Bereicherung – was sich schon daran erkennen lässt, dass im Kino die Untertitel nicht ausgestorben sind.