
Wenn Sie die Rechenschaftspflicht nicht prüfen können, ist es nur Marketing. Das sollten Sie beachten, und so schneiden die verschiedenen Ansätze ab.
Gewissen ist notwendig. Es reicht aber nicht.
Manche KI hat überhaupt keine Regeln. Manche folgt Regeln, kann aber nicht erkennen, wenn ihre Quellen sich gegenseitig nur widerspiegeln. Nur ein Typ prüft, ob die Informationen wirklich aus verschiedenen Quellen stammen.
Keine veröffentlichten Prinzipien. Kein Prüfprotokoll. Geschlossener Quellcode. Sie können nicht nachvollziehen, was passiert ist oder warum.
Die meisten KI-Assistenten für Verbraucher (ChatGPT, Gemini) fallen aus Sicht der öffentlichen Rechenschaftspflicht in diese Kategorie. Möglicherweise gibt es intern gute Praktiken, aber Sie können diese nicht überprüfen.
Erfordert externe Regulierung. Kann sich nicht selbst regulieren.
Folgt ethischen Regeln. Kann aber nicht erkennen, wenn alle Quellen voneinander abschreiben, und kann daher sicher falsch liegen.
Sicher unter Aufsicht. Kann Echokammern nicht selbst erkennen.
Folgt ethischen Regeln UND prüft, ob seine Informationen wirklich aus verschiedenen Quellen stammen. Wenn Einigkeit verdächtig aussieht, wird sie markiert, bevor gehandelt wird.
Das baut CIRIS.
Eine KI kann jede Regel befolgen, jede Prüfung bestehen und dennoch versagen, wenn alle Informationen aus derselben Quelle stammen. Genau diesen blinden Fleck hat CIRIS behoben.
Das sind die Dinge, die KI prüfbar und rechenschaftspflichtig machen. Die ersten sechs drehen sich darum, das Richtige zu tun. Das siebte geht darum, Situationen zu erkennen, in denen das Richtige auf falschen Informationen beruht.
Der Agent muss einem öffentlichen ethischen Rahmen folgen. Keine versteckten Regeln: ein Dokument, das jeder lesen und ihn daran messen kann.
Jede Aktion durchläuft eine Gewissensprüfung, bevor der Agent sie ausführt. Nicht im Nachhinein. Vorher.
Bei Unsicherheit oder möglichem Schaden fragt der Agent eine Person, anstatt zu raten. Im Arbeitsablauf integriert, nicht optional.
Jede Entscheidung wird aufgezeichnet und signiert, damit Sie genau nachvollziehen können, was passiert ist und warum. Ein Beleg für jede Aktion.
Die Zustimmung gilt in beide Richtungen. Sie können dem Agenten Nein sagen. Der Agent kann Ihnen Nein sagen. Keine Seite wird zur Kompromisseingabe gezwungen.
Sie können nicht prüfen, was Sie nicht sehen können. CIRIS ist vollständig quelloffen unter AGPL-3.0. Jeder kann den Code lesen, prüfen und verbessern.
Was Regeln allein nicht auffangen können.
Bevor der Agent handelt, stellt er sich die Frage: "Stammen meine Quellen wirklich aus verschiedenen Perspektiven, oder beziehen sie alle ihre Informationen aus derselben Quelle?" Zehn Quellen, die alle aus derselben Vorlage abgeschrieben haben, sind in Wirklichkeit nur eine einzige Quelle. Wenn Einigkeit zu einheitlich wirkt, markiert der Agent sie zur Überprüfung durch eine Person.
Zu uneinheitlich
Quellen widersprechen sich so stark, dass kein nützliches Ergebnis gezogen werden kann.
Gesund
Quellen unterscheiden sich tatsächlich. Echte Übereinstimmung bedeutet etwas.
Echokammer
Sieht wie Übereinstimmung aus, aber Quellen wiederholen sich nur gegenseitig.
Das macht CIRIS anders als andere KI-Rechenschaftsrahmen.
Interessieren Sie die Details? Lesen Sie die vollständige Abhandlung →Basiert auf öffentlich zugänglicher Dokumentation vom Februar 2026. Falls wir etwas übersehen oder falsch dargestellt haben, teilen Sie es uns mit.
| Projekt | Prüft jede Entscheidung | Veröffentlichte Regeln | Eingebautes Gewissen | Nachweis der Aktionen | Open Source | Echokammer-Erkennung |
|---|---|---|---|---|---|---|
| CIRIS | Ja | Ja | Ja | Ja | AGPL-3.0 | Ja |
| Constitutional AI | Nur beim Training | Implizit | Nein | Nein | Nein | Nein |
| LlamaFirewall / NeMo Guardrails | Ja | Nein | Nein | Protokollierung | Ja | Nein |
| HatCat | Ja | Teilweise | Steuerung | Teilweise | CC0 | Nein |
| Ethikausschüsse / Governance-Rahmen | Nein | Ja | Nein | Manuell | Unterschiedlich | Nein |
Ausgabefilter und Governance-Rahmen lösen wichtige, aber unterschiedliche Probleme. Filter blockieren schädliche Ausgaben. Ein Gewissen denkt über Werte nach. CIRIS zielt darauf ab, beides zu tun, und die blinden Flecken zu erkennen, die keiner der beiden Ansätze alleine adressiert.
Blockiert gefährliche Ausgaben: Prompt-Injection, schädliche Inhalte, feindliche Angriffe. Wie ein Filter, der schlechte Dinge beim Ausgang abfängt.
Bedenkt, ob eine Aktion richtig ist, nicht nur ob sie sicher ist. Wie ein Richter, der die Lage abwägt, bevor er eine Entscheidung trifft.
Prüft, ob Übereinstimmung echt oder nur Wiederholung ist. Wie ein Faktenprüfer, der fragt: "Haben Sie alle denselben Artikel gelesen?"
Viele kleinere Agenten, jeder an veröffentlichte Prinzipien gebunden, jeder prüfbar, jeder der menschlichen Autorität unterworfen. Kein einzelnes Unternehmen oder keine einzelne Einheit kontrolliert den gesamten Stack. Je unabhängiger die Agenten, desto schwieriger ist es, dass ein einziger Fehler sich ausbreitet.
Das ist aktive Forschung. Wir kommunizieren offen darüber, was etabliert ist und was noch getestet wird.
Gut belegt
Wird noch getestet
Beim Denken zuschauen
Sehen Sie Schritt für Schritt, wie ein echter Agent denkt. Eine Spur erkunden →
Die Identität verifizieren
Sehen Sie, wie Agenten beweisen, wer sie sind, wie ein Führerscheinamt für KI. Vertrauen & Identität →
Loslegen
Stellen Sie Ihren ersten Agenten bereit oder lesen Sie die Abhandlung in einfachem Deutsch. Erster Kontakt →
Jede Aussage auf dieser Seite wird durch Code belegt, den Sie lesen können, durch Spuren, die Sie überprüfen können, und durch Forschung, die Sie nachschlagen können. Darum geht es.