Ihr Browser ist veraltet. Bitte aktualisieren Sie Ihren Browser auf die neueste Version, oder wechseln Sie auf einen anderen Browser wie ChromeSafariFirefox oder Edge um Sicherheitslücken zu vermeiden und eine bestmögliche Performance zu gewährleisten.

Zum Hauptinhalt springen

Chat-GPT gegen Gemini
Zusammen­fassung statt Such­resultate: Macht Google den Weblink überflüssig?

The ChatGPT app icon is being displayed on a smartphone among other AI-powered applications in this photo illustration in Brussels, Belgium, on February 16, 2024. (Photo Illustration by Jonathan Raa/NurPhoto via Getty Images)
Jetzt abonnieren und von der Vorlesefunktion profitieren.
BotTalk

Nach dem «Krieg der Suchmaschinen» tobt nun im Silicon Valley der «Krieg der künstlichen Intelligenz» (KI). Dieser Kampf ist im übertragenen Sinne zu verstehen. Gemeint ist der harte Wettbewerb unter US-Technologiefirmen um KI-Anwendungen, der diese Woche neu befeuert wurde.

Sowohl die aufstrebende Firma Open AI, die hinter Chat-GPT steht, wie auch Google haben verbesserte Versionen ihrer KI-Modelle vorgestellt. Im Folgenden geben wir einen Überblick über die wichtigsten Entwicklungen:

KI von Open AI wird menschlicher

Open AI ist eines der führenden Unternehmen im Bereich der KI. Es gehört zwar zu keinem grossen Techkonzern, doch US-Softwarehersteller Microsoft hat 13 Milliarden Dollar in den Aufbau investiert. Open AI hat sein KI-Modell so weiterentwickelt, dass es den Dialogroboter Chat-GPT schneller, intelligenter und benutzerfreundlicher macht.

Das aufdatierte Modell GPT-4o zielt darauf ab, Chat-GPT in einen digitalen persönlichen Assistenten zu verwandeln, der in Echtzeit gesprochene Dialoge führen und Emotionen sowohl erkennen als auch stimmlich nachbilden kann.

Zudem kann der Roboter Text verstehen und «Sehkraft» entwickeln. Letztere Anwendung kann von Nutzern hochgeladene Screenshots, Fotos, Dokumente oder Diagramme erkennen und eine Einschätzung dazu abgeben.

KI von Google wird zum «Teammitglied»

Als direkte Antwort auf Chat-GPT lancierte Konkurrent Google sein KI-Modell mit Namen Bard, das jetzt Gemini heisst. Es beherrscht ähnliche Funktionen wie Chat-GPT und kann Text, Sprache oder Bilder verarbeiten.

Weiter verfügt Gemini ebenfalls über einen virtuellen Assistenten. Dieser kann dabei helfen, den Überblick über Aufgabenlisten zu behalten, Daten zu organisieren und Arbeitsabläufe zu verwalten.

Darüber hinaus kann Gemini gezielte Vorschläge machen, beispielsweise kinderfreundliche Restaurants an bestimmten Orten empfehlen oder Defekte von Geräten erkennen. Dazu reicht es, eine Videosequenz mit dem vermuteten Schaden hochzuladen.

Zeitenwende bei den Suchergebnissen

Das lässt aufhorchen: Google experimentiert mit Gemini bei Onlinesuchanfragen damit, mehrere Arten von Ergebnissen zu liefern. Dazu gehören neu kurze Zusammenfassungen, die von der KI erstellt werden. Diese Resultate sollen gegenüber den herkömmlichen Links zu einer bestimmten Website bevorzugt werden.

Branchenbeobachter sehen darin einen grundlegenden Wandel. Die Kurzangaben haben zwar zum Ziel, die Suche nach Informationen zu beschleunigen. Die Abkehr von Links könnte aber auch den Fluss des werberelevanten Internetverkehrs beeinträchtigen, da weniger Nutzerinnen und Nutzer auf die Links klicken.

Das ist der wunde Punkt ausgerechnet von Google: Der Konzern läuft Gefahr, dass die KI-Übersichten die mit seiner Suchmaschine verknüpften Werbeanzeigen untergraben. Dieses Geschäft brachte allein im vergangenen Jahr 175 Milliarden Dollar ein.

Onlineauftritte von Medienhäusern, Blogs und Firmenwebsites dürften ebenfalls betroffen sein. Gut möglich, dass die KI-Zusammenfassungen so informativ werden, dass ein Klick auf die ursprüngliche Quelle überflüssig wird.

«Nicht nur der Inhalt, sondern auch der Absender ist relevant.»

Markus Christen, Digital Society Initiative

Genau darin sieht Markus Christen, Geschäftsleiter der Digital Society Initiative der Universität Zürich, einen Knackpunkt: «Ich hoffe, dass man neben der Kurzzusammenfassung immer auch noch die Quellen in Form von Links erhält.» Bei den Links schätze er, dass er die Quelle ausgewiesen erhalte und so aufgrund seiner eigenen Erfahrung einschätzen könne, wie glaubwürdig der Urtext sei.

Die interdisziplinäre Initiative befasst sich mit dem digitalen Wandel, unter anderem mit den Folgen von KI. Christen glaubt nicht, dass Medienartikel und Blogeinträge in der Bedeutungslosigkeit verschwinden. Solche Erzeugnisse dienten oft dazu, «eine bestimmte Sicht auf Dinge darzustellen. Das heisst, nicht nur der Inhalt, sondern auch der Absender ist relevant.»

Klare Positionsbezüge seien gerade in der heutigen Zeit gefragt. Gehe es jedoch um «reine Fakten, die kurz und knackig präsentiert werden sollen», so könnten kurze Zusammenfassungen durchaus nützlich sein.

Chat-GPT gegen Gemini: Wer ist besser?

On display is the new Atari Flashback 2 video game console in San Francisco, Thursday, Sept. 15, 2005. The Atari Flashback 2 recreates the classic home video gaming experience of decades past. Instead of requiring cartridges like the original Atari, Inc. console, these games are programmed in and offer a peek back at the good old days of Pong, Centipede, Asteroids and others. (AP Photo/Paul Sakuma)

Das Onlinetechnologiemagazin «Beebom» hat die verbesserten Angebote mehreren Tests zu logischem Denken und zum multimodalen Verstehen unterzogen. Multimodal bedeutet, dass eine KI mehrere Arten von Daten verbinden kann, um eine Aussage zu treffen. Gemäss «Beebom» schnitt Chat-GPT in sieben von acht Tests besser ab.

Eine der Aufgaben bestand darin, ein einfaches Computerspiel im Stil der 1980er-Jahre in der Programmiersprache Python zu schreiben. Wie das Magazin berichtet, hat Chat-GPT innerhalb von Sekunden ein funktionierendes Spiel erstellt. Gemini hingegen habe es nicht geschafft, einen richtigen Code zu generieren.