AI, Large Language Models, Agenten. Schöne Werkzeuge. Ohne Kontext werden sie zur schnellsten Methode, mit voller Überzeugung falsche Antworten zu produzieren. „Kontext“ ist zu einem dieser Begriffe geworden, den alle verwenden und niemand gleich versteht. Wer ihn nicht greifbar macht, kann ihn weder aufbauen noch steuern noch absichern.
Nennen wir den Input, den AI tatsächlich braucht, beim Namen: AI-Ready Data. Im Folgenden stelle ich eine Formel vor, die sichtbar macht, woraus AI-Ready Data besteht und warum sie multiplikativ wirkt: Sobald ein Faktor gegen Null geht, kippt das gesamte System.
Wie sieht die Formel für AI-Ready Data aus?
Der realisierte Kontext bestimmt die Qualität von AI-Ready Data. Er wirkt multiplikativ. Fällt ein Faktor auf Null, bricht das Ganze zusammen und AI wird zur Halluzinationsmaschine. Welches Niveau jeweils nötig ist, hängt vom konkreten Use Case ab.

Schauen wir die fünf Faktoren einzeln an.
Was bedeutet Demokratisierung (d) für AI-Ready Data?
Demokratisierung meint nicht „offener Zugriff“ und schon gar nicht „jeder kann alles abfragen“.
Es geht um Geschwindigkeit und Verlässlichkeit beim
- Finden der richtigen Daten und des passenden Wissens
- Verstehen, was sie bedeuten
- Bewerten, ob sie für den Zweck geeignet sind
- Zugreifen, schnell genug, um operativ nutzbar zu sein
Demokratisierung ist ein Multiplikator, weil die Geschwindigkeit der Recherche Teil der Korrektheit ist. Wenn Menschen den passenden Kontext nicht verlässlich finden und einordnen, nehmen sie das, was in Reichweite liegt. AI macht dasselbe, nur schneller.
Versagensmuster: „Wir haben das irgendwo.“ Dieser Satz ist das Geräusch, mit dem d gegen Null tendiert.
Warum reicht ein Glossar bei Metadaten und Wissen (M+K) nicht aus?
Hier liegt das Kernmissverständnis: Teams setzen „Wissen“ mit einem Glossar gleich. Ein Glossar ist ein Anfang, manchmal ein notwendiger. Es ist nicht der Raum.
Metadaten sind der Raum, in dem Daten und Artefakte für Mensch und Maschine lesbar werden. Dazu gehören:
- technische Metadaten (Schemata, Pipelines, Lineage)
- operative Metadaten (Nutzung, Qualitätssignale, Aktualität)
- soziale Metadaten (Bewertungen, Kommentare, Verhalten, Entscheidungen)
- Governance-Metadaten (Ownership, Policies, Klassifikationen, zulässige Zwecke)
- und semantische Modelle
Die Tiefe von Metadaten und Wissen reicht von flachen Taxonomien (Glossaren) bis zu formalen Ontologien. Welche Ausprägung sich lohnt, hängt vom Use Case ab und davon, welche Agent-Genauigkeit und welche Transparenz Sie brauchen. „Nur Glossar“ reicht nicht automatisch. „Ontologie überall“ ist nicht automatisch die richtige Antwort. Für die Formel zählt ein einfacher Punkt: (M+K) darf nicht Null sein.
Wenn Bedeutung fehlt, kann AI sie nicht „ableiten“. AI erfindet sie.
Versagensmuster: „Das Modell wird das schon hinkriegen.“ Nein, das Modell rät. Und Ihr Unternehmen operationalisiert dann diese Vermutung.
Welche Rolle spielen Daten (D) im Gesamtbild?
Klingt selbstverständlich, ist aber wichtig: AI-Ready Data sind nicht nur Tabellen. Dazu gehören:
- strukturierte Daten (Warehouse, Lakehouse, operative Systeme)
- unstrukturierte Daten (Dokumente, Tickets, Policies, Verträge)
- die Verbindungsstücke (Dashboards, Kennzahlendefinitionen, Semantic Layer)
Die Falle liegt in dem Glauben, D allein würde reichen.
Mehr Daten ohne (M+K) bedeuten nur mehr Mehrdeutigkeit. Mehr Daten ohne (T+G) bedeuten nur mehr Risiko.
Versagensmuster: „Lasst uns einfach alles ingestieren.“ Das ist keine Strategie. Das ist eine unkontrollierte Ausdehnung von Haftung.
Wie sichern Trust und Governance (T+G) AI-Ready Data ab?
An dieser Stelle sterben die meisten AI-Initiativen leise. Nicht weil Governance Wert blockiert, sondern weil Wert ohne Kontrollen zum Incident wird. Trust ist hier kein Gefühl, sondern ein Qualitäts-Stack aus:
- Datenqualität
- Modellqualität
- Anwendungsqualität
Governance ist der Durchsetzungsmechanismus. Keine Folie. Kein Policy-PDF. Kontrollen, die tatsächlich laufen.
Denken Sie in Kontrollfamilien:
- Lineage- und Provenance-Kontrollen: Herkunft, Veränderung, Versionierung, Audit-Trails
- Zugriffs- und Policy-Kontrollen: Rollen und Rechte, zweckgebundener Zugriff, Maskierung und Redaktion, Geheimhaltungsstufen, Lizenz- und Nutzungsregeln
- Governance-Kontrollen: klare Owner und Stewards, Freigaben, Standards, Data Contracts und SLAs, Compliance-Checks
- RAG- und Agent-Kontrollen: zugelassene Quellen, Guardrails, Attributionsregeln, Grounding-Checks, Drift- und Bias-Monitoring, Prompt- und Tool-Permissions
- Operative Kontrollen: Monitoring, Alerts, Incident Handling, Change Management
- Souveränitäts-Kontrollen: wo Daten und Modelle laufen, was Grenzen überquert, wer die Schlüssel hält
Qualität beschreibt, wie gut Ihr Kontext ist. Kontrollen sorgen dafür, dass er gut bleibt, legal bleibt, sicher unter Ihrer Kontrolle bleibt und an der Intention ausgerichtet bleibt.
Versagensmuster: „Governance machen wir später.“ Später ist nach dem ersten Leak, der ersten falschen Entscheidung oder der ersten regulatorischen Anfrage.
Warum sind Strategie und Kultur (S+C) der unbequeme Exponent?
Der Exponent zeigt, ob ein Unternehmen es ernst meint. Sie können Daten, Metadaten und Governance haben und trotzdem scheitern, wenn
- AI nicht an der Strategie ausgerichtet ist
- Use Cases nicht ausgewählt und priorisiert werden
- die Ökonomie nicht verstanden wird
- AI Literacy auf Führungs- und Operator-Ebene fehlt
- das Operating Model unklar bleibt (wer besitzt was, wer gibt frei, wer haftet)
- Kommunikation schwach ist und Adoption zur Schattennutzung wird
Strategie und Kultur „unterstützen“ AI-Ready Data nicht. Sie entscheiden, ob daraus operative Realität wird.
Versagensmuster: „Wir haben die Plattform gekauft.“ Ein Hammer baut noch kein Haus.
Wer den Kontext kontrolliert, kontrolliert die AI
Warum „Kontext“ so wichtig ist, ist keine philosophische Frage. Es ist eine ökonomische und politische Frage innerhalb Ihrer Architektur.
Wer den Kontext kontrolliert, kontrolliert die AI. Wer die AI kontrolliert, kontrolliert die Entscheidungen. Wer die Entscheidungen kontrolliert, kontrolliert die Geschäftsergebnisse und verlangt Miete für den Zugang.
Genau deshalb haben die Context Wars begonnen. Anbieter bauen Mautstellen rund um Bedeutung, nicht mehr nur rund um Speicher. Endkunden sollten Context Authority und Souveränität einfordern, nicht nur „AI Features“. Unterschätzen Sie dieses Thema nicht.
Was Sie als Nächstes tun sollten
Wenn Sie AI-Ready Data im eigenen Haus aufbauen wollen, beginnen Sie hier:
- Bewerten Sie für jeden geplanten AI Use Case alle fünf Faktoren auf einer Skala von 0 bis 1
- Identifizieren Sie den schwächsten Faktor, denn er begrenzt das Gesamtergebnis
- Investieren Sie zuerst dort, bevor Sie mehr Daten oder mehr Modelle beschaffen
- Verankern Sie Kontrollen, bevor Sie ausrollen
Wenn Sie diese Bewertung gemeinsam mit Analysten und Praktikern strukturieren wollen, sprechen Sie mit dem BARC-Team. Wir begleiten Unternehmen seit über 25 Jahren bei Strategie, Architektur und Governance rund um Data und AI.
Nächster Schritt: Buchen Sie ein AI-Ready Data Assessment mit BARC und finden Sie den schwächsten Faktor in Ihrer Formel, bevor er Ihr nächstes AI-Projekt ausbremst.