No Women, no AI (pt.2) – Sind KI Biases ein gesellschaftliches Problem?
- Cornelia Hebrank

- vor 1 Tag
- 4 Min. Lesezeit
Viele Nutzer*innen vertrauen KI Antworten stärker als klassischen Suchergebnissen. Problematisch wird das dann, wenn moderne Chatbots ihre Antworten sehr überzeugend formulieren, selbst dann, wenn Aussagen unvollständig oder falsch sind. Ein absurdes Beispiel dafür ist Grok, die KI von Elon Musk, die ihn grundsätzlich als absolut großartig darstellt (egal was er tut) und seine Ideologien als die einzige Wahrheit kommuniziert! In diesem Fall ist das zwar so sehr überzogen, dass vermutlich die wenigsten die Aussagen allzu ernst nehmen. Aber was, wenn die Aussagen weniger überzogen sind und gar realistisch klingen... aber am Ende halt doch falsch sind?

Im zweiten Teil meiner „No Women, no AI“-Serie schauen wir uns deshalb genauer an, wie Bias in KI überhaupt entsteht, warum Trainingsdaten dabei eine zentrale Rolle spielen und weshalb das gesellschaftlich relevant ist.
Wie entstehen KI Biases? Oder: alles eine Frage der Gesellschaft?
Um diese Frage zu klären, müssen wir uns etwas genauer anschauen, wie KI funktioniert. Der Ursprung unserer heutigen KI kommt aus der Datenanalyse und dem Auswerten von statistischen Daten, deshalb ist KI immer ein datengetriebenes System. Die modernen Modelle werden also nicht mehr von Menschen direkt programmiert, sondern „lernen“ ihr Verhalten von den Daten.
Wie genau dieses Lernen funktioniert, kommt auf den Typ von KI an. Bei Bilderkennung nutzt man meistens das supervised learning, bei dem der Mensch durch die Trainingsdaten auch das gewünschte Ergebnis vorgibt. Aber gerade bei generativer KI lässt sich das nicht mehr ganz so leicht machen und so lernt dieser Typ von KI deutlich unabhängiger von menschlicher Kontrolle. Doch auch hier entscheiden die Daten, was gelernt wird. Und es ist bekannt, dass einige der großen Chatbot-Anbieter einfach mit Abzügen verschiedenster Seiten aus dem Internet arbeiten – also: der Chatbot lernt, was im Internet steht. Wie wir alle wissen, wenns im Internet steht, dann muss es ja stimmen!
Das bedeutet also, dass die Datengrundlage alles andere als sauber aufgeräumt ist und definitiv auch Falschinformationen und alte Daten beinhaltet. Und wenn in großen Foren bestimmte Nischenmeinungen diskutiert werden, und diese in der Datengrundlage landen, dann kann sich auch das Verhalten des Chatbots entsprechend verzerren. Für uns Frauen heißt das, dass die alteingesessenen Meinungen zu Rollenbild und Co stark vertreten sind und damit auch die Chatbots entsprechend beeinflussen. Dass das in besonderen Bereichen, wie beispielsweise der Medizin, in der immer noch viele Studien rein auf Männern basieren, ein sehr verzerrtes Bild gibt, brauchte ich glaube ich nicht weiter zu erklären.
Aber am Ende ist das Internet natürlich auch „nur“ ein Abbild unserer Gesellschaft, also könnte man auch fragen, ob die nicht das eigentliche Problem ist. Leider gibt es aber auch schon beim Zugang zum Internet und der Menge der User starke weltweite Verzerrungen: ein Großteil der Posts kommen aus Nordamerika, während Kontinente wie Afrika und auch Asien gerade in den Trainingsdaten eher unterrepräsentiert sind. Dieser Fokus bedeutet für uns Europäer, dass auch unsere gesellschaftlichen Schutzmaßnahmen damit ausgehebelt werden, dass die Chatbots zu einem großen Teil auf amerikanischen Werten basieren.
Und warum ist das alles ein Problem?
Eigentlich ist den meisten von uns klar, dass nicht alles, was im Internet zu finden ist, auch so stimmt. Mit den Chatbots ist das aber immer so eine Sache: die sind voll überzeugt von ihren Aussagen und stellen vieles so dar, als wäre es offensichtlich die einzige Wahrheit. Das löst bei vielen Menschen ein gewisses Grundvertrauen aus und sie glauben die Aussagen, ohne sie nochmal zu prüfen.
Bei Suchmaschinen ist es etwas anders, weil man dort zumindest noch die Webseiten selbst mit angezeigt bekommt und dadurch die Glaubwürdigkeit etwas direkter einschätzen kann. Wenn ich Ergebnisse von der offiziellen Seite einer Behörde oder Stadt angezeigt bekomme, dann werte ich die Inhalte anders als die eines beliebigen Forums. Aber seit es selbst bei der Suche die Chatbot-Zusammenfassungen gibt, ist diese Abwägung zu zusätzlichem Aufwand geworden.
Und an dieser Stelle werden Biases besonders relevant. Als ich vor der Bürgermeisterwahl etwas dazu gesucht habe, wurde in der Zusammenfassung nur einer der beiden Hauptkandidaten genannt. Ich habe mich darüber gewundert und aktiv nach der Meinung des zweiten gesucht, aber es ist nachgewiesen, dass durch solche Taktiken eine unterbewusste Beeinflussung der Wähler möglich ist, weil damit einer der Kandidaten präsenter wirkt.
Wenn ihr nun aktiv und regelmäßig einen Chatbot nutzt, dann wird das ganze nur noch schlimmer. Die Unternehmen hinter dem Bot möchten natürlich, dass ihr ihn so viel wie möglich nutzt und immer mehr mit ihm schreibt, denn so bekommen sie mehr Daten und idealerweise auch mehr Geld. Vermutlich ist euch auch schonmal aufgefallen, dass Chatbots euch gerne in allem bestärken: „das ist eine gute Idee“ und „das stimmt natürlich“ sind typische Anfänge für deren Antworten. Das bedeutet aber auch, dass ihr mehr Aussagen angezeigt bekommt, die zu euren Fragen und eurem Standpunkt passen. Ist ja auch bequemer, als sich kritisch mit den Themen auseinanderzusetzen…
Und falls ihr mir jetzt widersprecht, dass ihr euren Systemprompt so gut angepasst habt, dass das bei euch nicht passiert: super! Das freut mich wirklich. Aber ganz viele Leute nutzen die Technologie, ohne so sehr im Detail darüber nachzudenken. Und bei denen passiert vermutlich genau das, was ich grade beschrieben habe.
Auf jeden Fall haben wir schon festgestellt, dass viel an der Problematik mit der Entwicklung und Anpassung von KI und KI-Systemen zu tun hat, also möchte ich mich beim nächsten Teil etwas mehr mit der Entwicklung beschäftigen, und damit, wie diese reguliert wird: durch den EU AI Act.

Kommentare