KI halluziniert – und du? Über Wissen, Grenzen, Verantwortung

KI halluziniert. Aber wir auch. Weiß die KI, dass sie nichts weiß? Und – weißt du es?

Ein Essay

Ein Stammtischabend am Tegernsee

Es war beim vorletzten Treffen unseres KI-Stammtisch Tegernsee. Die übliche Mischung aus KI-Nativen, KI-Begeisterten, KI-Interessierten – alle irgendwie damit beschäftigt, alle irgendwie unsicher. Aber alle definitiv begeistert und überzeugt, dass das Thema KI wichtig ist. Irgendwann dann der Satz, den man immer wieder hört: „Die KI ist ja nicht wirklich intelligent."

Ich nickte zuerst ebenfalls, wie alle. Aber während ich noch nickte, fragte bereits etwas in mir: Bin ich mir da eigentlich sicher? Bin ich selber wirklich "besser/schlauer/intelligenter"? Oder mache ich mir – selbstgefällig wie ich bin – nur was vor?

Diese Frage ließ mich nicht los. Sie ist der Grund, warum ich hier sitze und das aufschreibe – als Gespräch mit mir selbst. Vielleicht auch mit dir.

Was Cleese eigentlich sagte

Bevor wir der KI ihre Intelligenz absprechen, müssten wir eigentlich klären, was Intelligenz überhaupt ist. Und – noch unbequemer – wie wir herausfinden würden, ob wir selbst sie haben.

John Cleese hat zum “Gegenstück der Intelligenz” vor Jahren etwas gesagt, das ich extrem lustig, aber auch sehr lehrreich fand:

„I think the problem with people like this is that they are so stupid that they have no idea how stupid they are. You see, if you're very, very stupid, how can you possibly realize that you're very, very stupid? You'd have to be relatively intelligent to realize how stupid you are."

Das ist die populäre Version des sogenannten Dunning-Kruger-Effekts: Wer wirklich inkompetent ist, dem fehlt genau die Kompetenz, das zu merken. Selbstüberschätzung schützt sich selbst.

Eine Vorsicht muss hier rein – sonst widerspreche ich gleich am Anfang meiner eigenen These. Die Originalstudie von Kruger und Dunning aus dem Jahr 1999 ist methodisch nicht unumstritten; ein Teil dessen, was als „Dunning-Kruger-Kurve" durch die Popmedien geistert, könnte auch ein statistisches Artefakt sein. Aber der Kern überlebt: Mein Urteil über meine eigene Kompetenz hängt ausgerechnet von der Kompetenz ab, über die ich urteilen will. Ein Henne-Ei-Problem mit unbequemen Konsequenzen.

Und genau dieses Problem hat – auf ganz andere Weise – auch eine KI.

„Ich ‚weiß' nicht, dass ich etwas nicht weiß"

Ich habe das vor ein paar Tagen direkt ausprobiert. Habe Claude, ein großes Sprachmodell von Anthropic, gefragt, ob es das eigentlich weiß. Weiß die KI, dass sie nichts weiß? Sokrates, nur mal eben digital.

Die Antwort war ehrlicher, als mir lieb war:

„Was ich tatsächlich tue: Ich gebe Konfidenzhinweise ab. Aber das ist kein echtes Wissen über meine eigenen Wissensgrenzen – es ist ein statistisches Muster aus Training. Ich ‚weiß' nicht, dass ich etwas nicht weiß. Ich produziere Text, der so klingt wie jemand, der das weiß."

Lies das ruhig noch einmal langsam.

Was die KI da macht, ist – wenn man so will – sokratische Pose ohne sokratische Substanz. Sie klingt demütig. Sie kann aber gar nicht demütig sein, weil ihr der Zugang zu sich selbst fehlt. Sie produziert „ich bin mir nicht sicher" mit derselben statistischen Mechanik, mit der sie „der Eiffelturm steht in Paris" produziert. Es ist Text. Nichts dahinter.

Das ist kein Bug, der mit dem nächsten Update verschwindet. Das ist ein struktureller Defekt der Architektur. Eine KI kann nicht wissen, dass sie nicht weiß. Sie kann es nur klingen lassen.

Und in dem Moment, in dem ich das so klar lese, kommt der unangenehme Gedanke vom Stammtisch zurück.

Bin ich mir da eigentlich sicher?

Ich nicke beim Stammtisch, wenn einer sagt: „Die KI ist nicht wirklich intelligent." Aber wäre ich ehrlich, müsste ich drei Fragen aushalten, bevor ich nicke.

Erinnere ich mich wirklich besser?

Die Hirnforschung sagt seit Jahren: Erinnerungen sind keine Festplatte. Jedes Mal, wenn ich eine Erinnerung abrufe, wird sie neu zusammengesetzt – und neu abgespeichert. Elizabeth Loftus hat über Jahrzehnte gezeigt, wie leicht sich Erinnerungen verändern lassen; wie Menschen sich an Dinge erinnern, die nie passiert sind. Ihr TED-Vortrag „How reliable is your memory?" ist gerade einmal 18 Minuten lang – und verändert in dieser Viertelstunde, wie man auf jedes „aber ich erinnere mich genau" reagiert.

Ich erinnere mich nicht genau. Ich konstruiere etwas, das sich für mich anfühlt wie genaues Erinnern. Das ist – sage ich mit etwas Galgenhumor – nicht besonders weit weg von dem, was die KI macht, wenn sie selbstsicher halluziniert.

Weiß ich wirklich, was ich weiß?

Steven Sloman und Philip Fernbach haben dazu ein lesenswertes Buch geschrieben: The Knowledge Illusion. Ihre zentrale Pointe: Wir Menschen halten uns für deutlich wissender, als wir sind. Wer glaubt zu verstehen, wie ein Reißverschluss funktioniert, scheitert spätestens beim Versuch, das zu erklären oder zu skizzieren. Wer glaubt, sich in Politik auszukennen, hat oft genug drei Schlagworte und ein diffuses Bauchgefühl. Wir leben in einer kollektiven Wissens-Illusion und merken es nicht, weil unser soziales Umfeld die Illusion stützt.

Vereinfacht: Auch unser “Wissen” ist oft eher Muster als Substanz. Wir schöpfen aus eigener Erfahrung, sozialer und familiärer Prägung, aufgeschnappten Schlagworten – also aus etwas, das man auch genauso gut einen Trainingsdatensatz nennen könnte. Nur länger gewachsen und mit erlebten Schmerzen.

Bin ich wirklich verantwortungsvoller?

Hier wird es am schwierigsten. Was unterscheidet mich, wenn ich am Stammtisch selbstsicher etwas behaupte, das ich gar nicht wissen kann – von einer KI, die im Brustton der Überzeugung halluziniert?

Vielleicht weniger, als mir lieb wäre.

Was würdest du eigentlich finden, wenn du wirklich genau hinschauen würdest – statt nur zu glauben, dass du es tust?

Der Unterschied ist nicht das Sein. Sondern das Können.

Jetzt könnte man meinen, ich landete bei der billigen Pointe “wir sind alle gleich" – die KI halluziniert, wir halluzinieren, alles fein. Aber das wäre zu billig. Es gibt einen Unterschied. Er liegt nur nicht da, wo wir ihn gern hätten.

Er liegt nicht in der Ethik. Ethik steckt auch in den Trainingsdaten der Modelle – tausende Bücher, Gerichtsurteile, philosophische Traktate. Eine moderne KI kann ethische Argumentation oft sauberer durchspielen als drei Viertel der Menschen – am Stammtisch oder sonstwo – mich inklusive.

Er liegt auch nicht in der Moral. Auch da hat die Menschheit einen erstaunlich "gemischten" Track Record.

Er liegt darin, was wir könnten.

Eine KI kann nicht innehalten. Sie kann nicht zweifeln, nicht im Sinne eines echten Zweifels. Sie hat kein Innen, das sie befragen könnte. Sie produziert das nächste wahrscheinliche Wort und dann das nächste. Sie ist – in diesem Sinne – unschuldig, weil sie nicht anders kann.

Wir aber könnten. Wir könnten innehalten. Wir könnten fragen. Wir könnten widersprechen, auch uns selbst. Wir könnten nachschlagen, prüfen, einen vertrauten Menschen anrufen und sagen: „Hör mal, denke ich da gerade Quatsch?"

Dass wir es oft nicht tun, macht es nicht weniger schlimm. Es macht es schlimmer. Die KI halluziniert aus Notwendigkeit. Wir halluzinieren aus Bequemlichkeit.

Skin in the Game – und die Würde der Scham

Es gibt noch etwas, das uns von der KI unterscheidet. Und das ist der für mich wichtigste Punkt:

Wir haben etwas zu verlieren.

Wenn ich am Stammtisch eine selbstsichere Dummheit von mir gebe, hat das Konsequenzen. Ein Kollege schüttelt den Kopf. Eine Kundin verliert das Vertrauen. Mein eigenes Selbstbild bekommt einen Kratzer. Skin in the Game nennen das die Engländer – Haut im Spiel. Wir sind betroffen von den Konsequenzen unserer Behauptungen. Die KI ist es nie.

Und eng damit verbunden: Wir können uns schämen.

Scham ist vielleicht das menschlichste Gefühl überhaupt. Sie ist unangenehm, sie ist quälend, sie ist manchmal kaum auszuhalten. Aber sie ist auch ein eingebautes Korrektursystem. Wer sich schämt, hat im Innersten erkannt: Das gerade eben war nicht in Ordnung. Etwas in mir wusste es besser, und ich habe es übergangen.

Scham zwingt zum Hinsehen, wo man am Liebsten wegsehen möchte. Sie ist – wenn man so will – das menschliche Echo dessen, was die KI strukturell nicht haben kann: ein Innenleben, das gegen den glatten Output rebelliert.

Das ist nicht unser Adel. Das ist unser Werkzeug. Und ich glaube, wir nutzen es viel zu selten.

Was bleibt – als Frage, nicht als Antwort

Was folgt daraus? Vielleicht nicht das, was man am Stammtisch hören will.

Es folgt nicht, dass wir der KI grundsätzlich misstrauen müssten, weil sie eine Maschine ist. Sie ist ein verdammt nützliches Werkzeug – im Klartext: für vieles besser als wir, für anderes völlig ungeeignet und für die wirklich wichtigen Dinge schlicht nicht zuständig.

Es folgt aber auch nicht, dass wir uns über sie erheben sollten, weil wir Menschen sind und Menschen ja schließlich denken können. Das tun wir nämlich oft genug nicht. Wir nicken am Stammtisch mit. Wir wiederholen Sätze, die andere uns vorgegeben haben. Wir nennen das dann “meine Meinung".

Was folgt, ist eher eine Einladung. Vielleicht sogar eine Zumutung. Verantwortung im Umgang mit KI heißt nicht, klüger zu sein als die Maschine. Sie bedeutet, das, was wir tun könnten, auch zu tun: zweifeln, leiden, lernen, uns schämen, korrigieren. Mutig und reflektiert mit etwas umzugehen, das all dies nicht kann.

Die Maschine wartet nicht darauf, dass du das tust. Sie würde auch weiterlaufen, wenn du nie wieder einen klaren Gedanken fasst. Aber dein Leben würde dann zu einem Echo. Und der Stammtisch zu einem Resonanzraum, in dem alle mit allen einig sind – ohne dass irgendjemand etwas wirklich weiß.

Weißt du, was du nicht weißt? Und – wichtiger – hast du den Mut, daraus etwas zu machen?

Nachwort: Wer hat hier eigentlich wen geführt?

Ich muss ehrlich sein, sonst stimmt der ganze Artikel hier nicht.

Diesen Text habe ich nicht allein geschrieben. Ich habe ihn im Gespräch mit einer KI entwickelt. Sie hat mich gefordert, mir widersprochen und gefragt, was ich eigentlich meine. Sie hat mir Quellen genannt, mich auf Schwachstellen meiner These hingewiesen, Vorschläge gemacht. Manche habe ich übernommen, andere verworfen, einige habe ich gegen ihren Vorschlag durchgesetzt.

Und ich weiß bis heute nicht mit letzter Sicherheit, ob sie mich tatsächlich herausgefordert hat – oder ob sie mir nur das geliefert hat, was ich hören wollte, in gerade so unbequemer Form, dass es nach Herausforderung klingt.

Genau diese Unsicherheit ist die Pointe. Die KI ist weder Orakel noch Spiegel. Sie ist Material. Ich nutze sie mal als Werkzeug, mal als Gegenüber, manchmal als Beides im selben Ansatz – und am Ende muss ich selbst entscheiden, was ich von ihr übernehme und was nicht. Wie am Stammtisch. Nur dass mein digitales Gegenüber mich nicht traurig oder erregt anschaut, wenn ich mal nicht nicke.

Vielleicht ist das die ehrlichste Antwort auf die Frage, mit der dieser Text beginnt. Weiß die KI, dass ich nichts weiß?

Sicherlich nicht. Aber sie hilft mir, mich das zu fragen.

Damit beende ich den heutigen Stammtisch – mit mir selbst.

Quellen & weiterführend

John Cleese, „Considers Your Futile Comments" (offizieller Monty-Python-YouTube-Kanal, 17. Februar 2012) – das hier zitierte Stupidity-Statement: https://youtu.be/x8Afv3U_ysc?t=213
Elizabeth Loftus, TED-Talk „How reliable is your memory?" (TEDGlobal 2013) – rekonstruktive Erinnerung: ted.com/talks/elizabeth_loftus_how_reliable_is_your_memory
Steven Sloman & Philip Fernbach, The Knowledge Illusion: Why We Never Think Alone (Riverhead Books, 2017, ISBN 978–0399184352)
Kruger & Dunning, „Unskilled and Unaware of It: How Difficulties in Recognizing One's Own Incompetence Lead to Inflated Self-Assessments" (Journal of Personality and Social Psychology, 1999)
Methodische Kritik dazu: Gignac & Zajenkowski, „The Dunning-Kruger effect is (mostly) a statistical artefact" (Intelligence, 2020): sciencedirect.com/science/article/abs/pii/S0160289620300271
KI-Stammtisch Tegernsee

Weiterdenken?

Solche Gespräche führe ich nicht nur am Schreibtisch. Der KI-Stammtisch Tegernsee trifft sich regelmäßig – offen für alle, die KI nicht nur nutzen, sondern auch verstehen wollen.

Komm vorbei. Ganz besonders gerne, wenn du NICHT nur nickst.

Andreas

Andreas Eder ist Gründer der KI-Botschafter und seit 2012 selbstständiger IT-Prozessberater. Als Diplomingenieur der Elektrotechnik mit über 40 Jahren Berufspraxis vereint er tiefes Technik- und Prozesswissen. Sein Schwerpunkt ist die menschenzentrierte, rechtssichere und ethische Einführung von KI. In seinen Artikeln auf diesem Blog teilt er sein Expertenwissen zu Schatten-KI, autonomen KI-Agenten, dem EU AI Act sowie praxisnahen Mitarbeiterschulungen und Datenschutz.

Beitrag teilen :

Weiß die KI, dass ich nichts weiß?

Inhaltsverzeichnis