Künstliche Intelligenz im TestClaude 3 ist hervorragend – aber ist er auch ein Chat-GPT-Killer?
Er sei besser als die Alternative von Open AI und habe sogar ein Bewusstsein – aber so ganz kann der KI-Chatbot diesem hohen Lob in unserem Test nicht standhalten.
Hat bei der künstlichen Intelligenz ein Evolutionssprung stattgefunden – schon wieder? Grund für die Spekulationen ist ein Chatbot, den die meisten von uns bisher nicht auf dem Schirm hatten. Er heisst Claude und stammt von einer gemeinnützigen Organisation aus San Francisco: Anthropic wurde 2021 von abtrünnigen Open-AI-Leuten gegründet und gehört heute mit Google, Facebook, Microsoft und Open AI zu den massgeblichen Akteuren rund um KI.
Die Aufregung rührt daher, dass Claude eine Testfrage als solche erkannt und benannt hat. Das interpretieren manche als Zeichen dafür, dass Claude ein Verständnis dafür habe, was er ist und was Menschen von ihm wollen – also eine Art Bewusstsein. Doch andere winken ab: Solche Bots seien schon immer darauf getrimmt gewesen, uns Menschen zu imitieren. Yannic Kilcher spricht Claude jegliche Empfindungsfähigkeit ab. Kilcher forscht zum maschinellen Lernen und ist erfolgreicher Youtuber. Die NZZ nannte ihn «einen coolen Nerd aus Zürich», und er erklärt in einem Video, auch bei Claude sei alles bloss Statistik: «Also entspannt euch, alles ist gut!»
Hier wird Inhalt angezeigt, der zusätzliche Cookies setzt.
An dieser Stelle finden Sie einen ergänzenden externen Inhalt. Falls Sie damit einverstanden sind, dass Cookies von externen Anbietern gesetzt und dadurch personenbezogene Daten an externe Anbieter übermittelt werden, können Sie alle Cookies zulassen und externe Inhalte direkt anzeigen.
Nicht empfindungsfähig – aber trotzdem eine Sensation? Anthropic sagt, ihr neuer Bot würde seine Konkurrenten bei den meisten der gängigen KI-Beurteilungs-Kriterien übertreffen: «Er zeigt ein nahezu menschliches Verständnis für komplexe Aufgaben und ist führend bei der allgemeinen Intelligenz.» Allerdings sagen solche Benchmarks wenig über die Alltagstauglichkeit aus. Die lässt sich nur durch Praxistests eruieren.
Ein Test auf Umwegen
Claude ist in der Schweiz bislang nicht freigeschaltet. Doch über ein VPN, also einen Daten-Tunnel in die USA, lässt sich die Geoblockade überwinden. Auf claude.ai gibt es eine kostenlose Testmöglichkeit von Claude 3 Sonnet. Das ist die zweitgrösste Variante des KI-Bots. Die leistungsfähigste heisst Claude 3 Opus. Für die sind 20 US-Dollar pro Monat zu entrichten.
Claude ist schnell und vielseitig, aber mitnichten ein Chat-GPT-Killer. Schon bei der ersten Frage – «Wer ist Alain Berset?» – leistet sich die KI einen Fauxpas: «Er ist derzeit Bundespräsident der Schweizerischen Eidgenossenschaft für das Jahr 2023», lautet die Antwort. Claudes Datenbestand reicht bis zum August 2023, als Bersets Rücktritt bereits bekannt war. Doch selbst wenn Claude die Demission nicht mitbekommen hat, wäre zu berücksichtigen, dass wir nicht mehr im Jahr 2023 leben.
Kein Verständnis, wo das Wissen endet
Dieser Schnitzer zeigt, dass Claude eine der grossen Schwächen aller KI teilt: das mangelnde Verständnis für die Lücken im Datenbestand und die Grenzen ihres Wissens. Auf Nachfrage räumt Claude ein, dass er neuere Ereignisse womöglich verpasst hat. Doch es bleibt dabei, dass solche KI nicht blauäugig benutzt werden dürfen: Es braucht die kritische Nachfrage und die Überprüfung der Informationen, die der Bot vermittelt. Claude stattet seine Auskünfte nicht mit Quellenangaben aus. Faktenchecks per Google sind unverzichtbar.
Eine weitere, simple Frage überfordert Claude komplett. Als er berühmte Personen nennen soll, die in Zürich geboren sind, zählt er Roger Federer (Basel), Albert Einstein (Ulm), Tina Turner (Brownsville, Tennessee), Thomas Hirschhorn (Bern), Johanna Spyri (Hirzel) und Jakob Steiner (Utzenstorf) auf. Nur bei Max Frisch liegt die KI richtig. Interessanterweise stellt das Konzept des Geburtsorts auch für andere KI, inklusive Chat-GPT, eine tückische Hürde dar. Vielleicht, weil sie selbst keine Geburt erlebt haben?
Trotz allem: Claude hat Potenzial
Anthropic sieht Claude nicht bloss als Chatbot. Die Software sei auch für Forschungszwecke, für Analysen grosser Datenbestände, für Marketing und die Erzeugung von Programmcodes geeignet. Einige sehen Stärken bei juristischen Texten. Es wird generell interessant zu sehen sein, in welchen Bereichen sich die Konkurrenzsysteme von Open AI, Google, Meta und Anthropic unterscheiden und hervortun.
Die Lehre bleibt, Claude nicht zu vermenschlichen und ihn nicht als mythisches Wunderwesen zu betrachten. Sehen wir ihn als das, was er ist: ein beeindruckendes Hilfsmittel, das mit seinen Fehlern fast schon human wirkt.
Fehler gefunden?Jetzt melden.