Warum KI nur so gut sein kann wie ihre Daten – und was das für Nutzer bedeutet
Von Mag-Info Tech editorial · 2026-06-28

Künstliche Intelligenz verspricht, Texte zu schreiben, Code zu generieren oder Fragen zu beantworten – doch hinter den Kulissen entscheidet die Qualität der Daten, wie nützlich diese Systeme wirklich sind. Die Schriftstellerin Margaret Atwood hat dies kürzlich in einem Gespräch beim Babell Literary and Cultural Festival in Porto deutlich gemacht. Nach eigenen Angaben testete sie einen großen Sprachmodell-Chatbot und kam zu dem Schluss, dass die Technologie nur so gut sein kann wie die Informationen, mit denen sie gefüttert wird. Ihre Kritik unterstreicht ein grundlegendes Prinzip der Informatik: "Garbage in, garbage out" – was hereinkommt, kommt auch wieder heraus. Doch was bedeutet das konkret für Nutzer, Entwickler und Unternehmen, die täglich mit KI arbeiten? Und wie können Anwender erkennen, ob die Antworten, die sie erhalten, auf soliden Grundlagen beruhen?
Wie Atwoods Erfahrung zeigt: Warum KI nicht immer hält, was sie verspricht
Margaret Atwoods kurze Interaktion mit einem Sprachmodell-Chatbot offenbarte ein Problem, das viele Nutzer intuitiv spüren, aber selten so präzise benennen: KI-Systeme sind nur so zuverlässig wie die Daten, auf denen sie trainiert wurden. Atwoods Fazit, dass der getestete Bot "Müll rein, Müll raus" lieferte, ist keine isolierte Beobachtung, sondern spiegelt eine strukturelle Schwäche vieler aktueller KI-Modelle wider. Sprachmodelle wie die von Atwood getesteten Systeme lernen aus riesigen Textmengen, die aus dem Internet zusammengetragen werden. Doch nicht alles, was im Netz steht, ist korrekt, aktuell oder frei von Vorurteilen. Wenn ein Modell etwa mit veralteten medizinischen Ratschlägen, falschen Fakten aus Foren oder rassistischen Stereotypen trainiert wird, reproduziert es diese Fehler – oft ohne Kontext oder Warnung.
Das Problem verschärft sich, wenn Nutzer die KI als Autorität behandeln. Ein Chatbot, der auf veralteten oder unvollständigen Daten basiert, kann plausible, aber falsche Antworten generieren. Atwoods Beispiel zeigt, dass selbst erfahrene Nutzerinnen und Nutzer schnell auf solche Fallstricke hereinfallen können. Besonders tückisch ist dies in Bereichen wie Bildung, Journalismus oder Recht, wo falsche Informationen schwerwiegende Konsequenzen haben. Für Entwickler bedeutet dies, dass sie nicht nur die technische Performance ihrer Modelle optimieren müssen, sondern auch die Qualität und Herkunft ihrer Trainingsdaten rigoros prüfen sollten. Für Anwender ergibt sich daraus die Notwendigkeit, KI-Ergebnisse stets kritisch zu hinterfragen – etwa durch Gegenrecherche oder den Vergleich mit vertrauenswürdigen Quellen.
Die Datenbasis entscheidet: Warum "Garbage in, Garbage out" heute relevanter ist denn je
Das Prinzip "Garbage in, Garbage out" ist kein neues Konzept, sondern stammt aus den Anfängen der Informatik. Doch in der Ära großer Sprachmodelle und generativer KI erhält es eine neue Dimension. Früher betraf es vor allem fehlerhafte Algorithmen oder fehlerhafte Eingaben in Tabellenkalkulationen. Heute geht es um die grundlegende Architektur moderner KI-Systeme: Sie lernen aus Daten, die sie nicht selbst überprüfen können. Die Herausforderung liegt darin, dass diese Daten oft unstrukturiert, mehrdeutig oder sogar manipuliert sind. Ein Beispiel sind KI-Modelle, die mit Texten aus sozialen Medien trainiert wurden. Diese enthalten nicht nur Falschinformationen, sondern auch emotionale Verzerrungen, Ironie oder gezielte Desinformation. Ein Sprachmodell, das solche Inhalte verarbeitet, reproduziert nicht nur die Fakten, sondern auch die Verzerrungen – und gibt sie als neutrale Antwort aus.

Ein weiteres Problem ist die mangelnde Transparenz. Viele Nutzer wissen nicht, welche Datenquellen in ein Modell eingeflossen sind oder wie aktuell diese sind. Ein Sprachmodell, das vor zwei Jahren trainiert wurde, kann keine aktuellen Ereignisse korrekt wiedergeben – es sei denn, es wird regelmäßig mit neuen Daten aktualisiert. Doch selbst dann bleibt unklar, welche Quellen bevorzugt oder ausgeschlossen wurden. Für Unternehmen, die KI in kritischen Prozessen einsetzen, etwa in der Kundenkommunikation oder im Personalwesen, bedeutet dies ein erhebliches Risiko. Eine KI, die auf veralteten oder fehlerhaften Daten basiert, kann nicht nur nutzlose, sondern sogar schädliche Entscheidungen treffen. Entwickler stehen daher vor der Aufgabe, ihre Datenpipelines zu überprüfen und sicherzustellen, dass die Eingaben nicht nur umfangreich, sondern auch qualitativ hochwertig sind.
Sprachmodelle unter der Lupe: Warum Atwoods Kritik an KI-Chatbots berechtigt ist
Atwoods Erfahrung mit dem getesteten Chatbot wirft ein Schlaglicht auf die Grenzen heutiger Sprachmodelle. Chatbots wie der von ihr getestete sind darauf ausgelegt, menschenähnliche Antworten zu generieren – nicht unbedingt korrekte oder vollständige. Das Problem liegt in der Art und Weise, wie diese Modelle trainiert werden. Sie optimieren nicht für Wahrheit, sondern für Wahrscheinlichkeit: Was klingt plausibel und passt zum Kontext? Diese Herangehensweise führt dazu, dass Chatbots oft Antworten liefern, die sich "richtig anfühlen", aber sachlich falsch sind. Ein klassisches Beispiel ist die Generierung von Zitaten oder historischen Fakten, die nicht existieren, aber so formuliert sind, dass sie authentisch wirken.
Hinzu kommt, dass viele Sprachmodelle keine Quellenangaben liefern. Nutzer erhalten eine Antwort, aber keine Hinweise darauf, woher die Informationen stammen oder wie vertrauenswürdig sie sind. Dies ist besonders problematisch in sensiblen Bereichen wie Medizin, Recht oder Bildung. Ein Nutzer, der einen Chatbot nach medizinischen Ratschlägen fragt, erhält möglicherweise eine detaillierte, aber falsche Diagnose – ohne dass das System warnt oder auf vertrauenswürdige Quellen verweist. Atwoods Kritik unterstreicht damit nicht nur die technischen Grenzen von KI, sondern auch die ethische Verantwortung der Entwickler. Sie müssen sicherstellen, dass ihre Modelle nicht nur nützlich, sondern auch transparent und nachvollziehbar sind.
Praktische Konsequenzen: Was Nutzer heute tun können, um bessere Ergebnisse zu erzielen
Atwoods Erfahrung ist ein Weckruf für alle, die täglich mit KI arbeiten. Doch was können Nutzer konkret tun, um sicherzustellen, dass sie brauchbare Ergebnisse erhalten? Der erste Schritt ist, sich bewusst zu machen, dass KI-Systeme keine neutralen Wissensspeicher sind, sondern Produkte ihrer Trainingsdaten. Nutzer sollten daher immer kritisch hinterfragen, was eine KI ausgibt – besonders wenn es um Fakten, Zitate oder komplexe Zusammenhänge geht. Ein einfacher Trick ist, dieselbe Frage an mehrere KI-Systeme zu stellen und die Antworten zu vergleichen. Weichen die Ergebnisse stark voneinander ab, ist Vorsicht geboten. Auch die Überprüfung der Quellen kann helfen: Wenn eine KI eine Information liefert, sollte der Nutzer selbst recherchieren, ob diese Quelle vertrauenswürdig ist.








Echte Ergebnisse von MEFAIs KI. Erhalten Sie $50 Rabatt auf den Pro-Plan.
Gesponsert · Vergangene Leistung ist kein Indikator für zukünftige Ergebnisse. Keine Finanzberatung.

Ein weiterer Ansatz ist, die Eingabeaufforderungen präzise zu formulieren. Je spezifischer die Frage, desto geringer ist die Wahrscheinlichkeit, dass die KI mit irrelevanten oder falschen Informationen antwortet. Statt "Erkläre mir etwas über KI" könnte eine bessere Frage lauten: "Erkläre mir die Funktionsweise von Transformern in Sprachmodellen und nenne drei aktuelle Anwendungsbeispiele." Durch die Eingrenzung des Themas wird die KI gezwungen, sich auf relevante Daten zu konzentrieren. Zudem sollten Nutzer darauf achten, ob das KI-System Quellenangaben liefert. Einige fortschrittliche Modelle bieten mittlerweile die Möglichkeit, Antworten mit Verweisen auf vertrauenswürdige Quellen zu untermauern. Diese Funktion ist besonders in professionellen Kontexten wertvoll, etwa beim Verfassen von Berichten oder Artikeln.
Entwickler in der Pflicht: Wie Unternehmen die Datenqualität ihrer KI-Systeme sichern können
Für Entwickler und Unternehmen, die KI-Systeme einsetzen oder entwickeln, ist die Datenqualität eine zentrale Herausforderung. Der erste Schritt ist die sorgfältige Auswahl der Trainingsdaten. Nicht alle Daten aus dem Internet sind gleichwertig – einige Quellen sind veraltet, andere enthalten Vorurteile oder Falschinformationen. Unternehmen sollten daher ihre Datenpipelines regelmäßig auditieren und sicherstellen, dass nur qualitativ hochwertige, aktuelle und relevante Daten verwendet werden. Ein weiterer Ansatz ist die Verwendung von gefilterten oder kuratierten Datensätzen. Einige Anbieter von Sprachmodellen setzen bereits auf gezielte Datenauswahl, etwa durch die Nutzung von wissenschaftlichen Artikeln, offiziellen Dokumenten oder redaktionell geprüften Texten. Diese Daten sind zwar weniger umfangreich als das gesamte Internet, aber deutlich zuverlässiger.
Ein weiterer wichtiger Aspekt ist die Transparenz. Entwickler sollten offenlegen, welche Datenquellen in ihre Modelle eingeflossen sind und wie diese Daten aufbereitet wurden. Dies hilft Nutzern, die Zuverlässigkeit der KI besser einzuschätzen. Zudem können Unternehmen Mechanismen einbauen, die Nutzer vor potenziell unzuverlässigen Antworten warnen – etwa durch Hinweise wie "Diese Information stammt aus einer Quelle von 2022 und könnte veraltet sein". Auch die regelmäßige Aktualisierung der Modelle ist entscheidend. Sprachmodelle, die nicht regelmäßig mit neuen Daten trainiert werden, verlieren schnell an Relevanz. Einige Anbieter bieten mittlerweile die Möglichkeit, Modelle kontinuierlich zu aktualisieren, um sicherzustellen, dass sie stets auf dem neuesten Stand sind.
Die ethische Dimension: Warum "Garbage in, Garbage out" auch eine gesellschaftliche Verantwortung ist
Atwoods Kritik an KI-Chatbots berührt nicht nur technische, sondern auch ethische Fragen. Wenn Sprachmodelle mit verzerrten oder falschen Daten trainiert werden, reproduzieren sie diese Verzerrungen – und verstärken sie sogar. Ein Beispiel ist die Darstellung von Geschlechterrollen in historischen Texten. Wenn ein Modell hauptsächlich aus Texten des 19. Jahrhunderts trainiert wird, reproduziert es möglicherweise veraltete Geschlechterklischees, ohne dass dies den Nutzern bewusst wird. Dies kann zu einer Verstärkung gesellschaftlicher Vorurteile führen, etwa in Bereichen wie Personalwesen oder Bildung. Entwickler stehen daher in der Verantwortung, nicht nur die technische Performance ihrer Modelle zu optimieren, sondern auch deren gesellschaftliche Auswirkungen zu bedenken.

Ein weiterer ethischer Aspekt ist die Frage der Urheberschaft. Viele Sprachmodelle lernen aus Texten, die ohne Zustimmung der Autorinnen und Autoren gesammelt wurden. Dies wirft Fragen nach Urheberrecht und fairer Vergütung auf. Einige Unternehmen haben bereits begonnen, Lizenzvereinbarungen mit Verlagen und Autoren abzuschließen, um sicherzustellen, dass ihre Daten rechtlich einwandfrei genutzt werden können. Doch dies ist erst der Anfang. Die Debatte um die ethische Nutzung von KI-Daten wird in den kommenden Jahren weiter an Fahrt aufnehmen – besonders, wenn immer mehr Unternehmen und Institutionen auf generative KI setzen.
Die Zukunft der KI: Braucht es strengere Regeln für Trainingsdaten?
Atwoods Kritik wirft auch die Frage auf, ob es strengere Regulierungen für die Nutzung von Trainingsdaten in KI-Systemen geben sollte. Aktuell gibt es kaum verbindliche Vorgaben, welche Daten in Sprachmodelle einfließen dürfen und wie diese aufbereitet werden müssen. Einige Länder und Regionen haben begonnen, Leitlinien zu entwickeln, etwa die EU mit ihrem KI-Gesetz. Doch diese Regeln sind oft vage und lassen viel Spielraum für Interpretation. Ein möglicher Ansatz wäre die Einführung von Zertifizierungen für KI-Systeme, die nachweisen, dass ihre Trainingsdaten bestimmten Qualitätsstandards entsprechen. Dies würde Nutzern mehr Sicherheit geben und Entwicklern klare Vorgaben liefern.
Ein weiterer Schritt wäre die Förderung von Open-Source-Datenbanken, die von unabhängigen Stellen kuratiert und geprüft werden. Diese könnten als vertrauenswürdige Grundlage für Sprachmodelle dienen und die Abhängigkeit von unkontrollierten Internetdaten verringern. Gleichzeitig müsste sichergestellt werden, dass diese Datenbanken divers und repräsentativ sind, um Verzerrungen zu vermeiden. Die Diskussion um die Regulierung von KI-Daten wird in den kommenden Jahren weiter an Bedeutung gewinnen – besonders, wenn immer mehr kritische Anwendungen auf KI setzen.
Fazit: KI ist nur so gut wie ihre Daten – und die Verantwortung liegt bei uns allen
Margaret Atwoods Kritik an KI-Chatbots ist ein wichtiger Impuls, um die Debatte über die Qualität und Zuverlässigkeit künstlicher Intelligenz voranzutreiben. Ihre Erfahrung zeigt, dass Nutzer nicht blind auf die Antworten von KI-Systemen vertrauen sollten, sondern deren Ergebnisse kritisch hinterfragen müssen. Gleichzeitig liegt die Verantwortung auch bei Entwicklern und Unternehmen, die sicherstellen müssen, dass ihre Modelle auf soliden, transparenten und ethisch vertretbaren Daten basieren. Die Zukunft der KI wird nicht nur von technologischen Fortschritten abhängen, sondern auch davon, wie wir mit den Daten umgehen, die diese Systeme antreiben. Für Nutzer bedeutet das: KI kann ein mächtiges Werkzeug sein – aber nur, wenn wir verstehen, wie sie funktioniert und welche Grenzen sie hat.
Mehr in Software & SaaS

Teenage Engineering KO II: Was die neue Firmware-Update für den Sampler bringt
Das neue Firmware-Update 2.5 für den Teenage Engineering KO II Sampler fügt USB-Audio, Lo-Fi-Modus, Reverse-Funktion, Arpeggiator und längere Sample-Länge hinzu – alles für 329 US-Dollar.

Apple beantragt Sondergenehmigung für RAM-Chips eines US-gesperrten chinesischen Herstellers
Apple strebt eine Ausnahmegenehmigung an, um Arbeitsspeicher von CXMT zu beziehen – ein chinesischer RAM-Hersteller, der vom Pentagon auf einer schwarzen Liste steht. Die Entscheidung könnte die Liefe

Apple erhöht Preise: Warum die KI-Obsession der Tech-Giganten auf uns abgewälzt wird
Apple und andere Tech-Konzerne erhöhen ihre Preise deutlich – doch die Begründung verweist auf KI-Entwicklungen, die viele Nutzer gar nicht wollen.

