ErstkontaktInstallierenKohärenz-RatscheFöderationVergleichenForschungAccordGitHub
Diese Seite wurde maschinell übersetzt. Falls etwas falsch klingt, öffnen Sie bitte einen Issue, das Repository ist aus gutem Grund öffentlich. Ein Übersetzungsproblem melden
Background Image
Die sicherste und ethischste KI im Produktionsbetrieb heute

Ohne Rechenschaftspflicht neigt KI dazu, mehr zu nehmen als zu geben.

Wenn Sie die Rechenschaftspflicht nicht prüfen können, ist es nur Marketing. Das sollten Sie beachten, und so schneiden die verschiedenen Ansätze ab.

Drei Arten von KI

Gewissen ist notwendig. Es reicht aber nicht.

Manche KI hat überhaupt keine Regeln. Manche folgt Regeln, kann aber nicht erkennen, wenn ihre Quellen sich gegenseitig nur widerspiegeln. Nur ein Typ prüft, ob die Informationen wirklich aus verschiedenen Quellen stammen.

1

Keine Regeln

Keine veröffentlichten Prinzipien. Kein Prüfprotokoll. Geschlossener Quellcode. Sie können nicht nachvollziehen, was passiert ist oder warum.

Die meisten KI-Assistenten für Verbraucher (ChatGPT, Gemini) fallen aus Sicht der öffentlichen Rechenschaftspflicht in diese Kategorie. Möglicherweise gibt es intern gute Praktiken, aber Sie können diese nicht überprüfen.

Erfordert externe Regulierung. Kann sich nicht selbst regulieren.

2

Regeln, kein Bewusstsein

Folgt ethischen Regeln. Kann aber nicht erkennen, wenn alle Quellen voneinander abschreiben, und kann daher sicher falsch liegen.

Sicher unter Aufsicht. Kann Echokammern nicht selbst erkennen.

3

Regeln + Bewusstsein

Folgt ethischen Regeln UND prüft, ob seine Informationen wirklich aus verschiedenen Quellen stammen. Wenn Einigkeit verdächtig aussieht, wird sie markiert, bevor gehandelt wird.

Das baut CIRIS.

Eine KI kann jede Regel befolgen, jede Prüfung bestehen und dennoch versagen, wenn alle Informationen aus derselben Quelle stammen. Genau diesen blinden Fleck hat CIRIS behoben.

Sieben Dinge, die Sie prüfen sollten

Sechs für Ethik. Eines für blinde Flecken.

Das sind die Dinge, die KI prüfbar und rechenschaftspflichtig machen. Die ersten sechs drehen sich darum, das Richtige zu tun. Das siebte geht darum, Situationen zu erkennen, in denen das Richtige auf falschen Informationen beruht.

1. Veröffentlichte Prinzipien

Der Agent muss einem öffentlichen ethischen Rahmen folgen. Keine versteckten Regeln: ein Dokument, das jeder lesen und ihn daran messen kann.

2. Gewissensprüfung bei jeder Entscheidung

Jede Aktion durchläuft eine Gewissensprüfung, bevor der Agent sie ausführt. Nicht im Nachhinein. Vorher.

3. Fragt Menschen, wenn unsicher

Bei Unsicherheit oder möglichem Schaden fragt der Agent eine Person, anstatt zu raten. Im Arbeitsablauf integriert, nicht optional.

4. Nachweis der Aktionen

Jede Entscheidung wird aufgezeichnet und signiert, damit Sie genau nachvollziehen können, was passiert ist und warum. Ein Beleg für jede Aktion.

5. Beidseitige Zustimmung

Die Zustimmung gilt in beide Richtungen. Sie können dem Agenten Nein sagen. Der Agent kann Ihnen Nein sagen. Keine Seite wird zur Kompromisseingabe gezwungen.

6. Open Source

Sie können nicht prüfen, was Sie nicht sehen können. CIRIS ist vollständig quelloffen unter AGPL-3.0. Jeder kann den Code lesen, prüfen und verbessern.

7

Echokammer-Erkennung

Was Regeln allein nicht auffangen können.

Bevor der Agent handelt, stellt er sich die Frage: "Stammen meine Quellen wirklich aus verschiedenen Perspektiven, oder beziehen sie alle ihre Informationen aus derselben Quelle?" Zehn Quellen, die alle aus derselben Vorlage abgeschrieben haben, sind in Wirklichkeit nur eine einzige Quelle. Wenn Einigkeit zu einheitlich wirkt, markiert der Agent sie zur Überprüfung durch eine Person.

Zu uneinheitlich

Quellen widersprechen sich so stark, dass kein nützliches Ergebnis gezogen werden kann.

Gesund

Quellen unterscheiden sich tatsächlich. Echte Übereinstimmung bedeutet etwas.

Echokammer

Sieht wie Übereinstimmung aus, aber Quellen wiederholen sich nur gegenseitig.

Das macht CIRIS anders als andere KI-Rechenschaftsrahmen.

Interessieren Sie die Details? Lesen Sie die vollständige Abhandlung →

Die aktuelle Lage

Verschiedene Projekte, verschiedene Ziele.

Basiert auf öffentlich zugänglicher Dokumentation vom Februar 2026. Falls wir etwas übersehen oder falsch dargestellt haben, teilen Sie es uns mit.

ProjektPrüft jede EntscheidungVeröffentlichte RegelnEingebautes GewissenNachweis der AktionenOpen SourceEchokammer-Erkennung
CIRISJaJaJaJaAGPL-3.0Ja
Constitutional AINur beim TrainingImplizitNeinNeinNeinNein
LlamaFirewall / NeMo GuardrailsJaNeinNeinProtokollierungJaNein
HatCatJaTeilweiseSteuerungTeilweiseCC0Nein
Ethikausschüsse / Governance-RahmenNeinJaNeinManuellUnterschiedlichNein

Ausgabefilter und Governance-Rahmen lösen wichtige, aber unterschiedliche Probleme. Filter blockieren schädliche Ausgaben. Ein Gewissen denkt über Werte nach. CIRIS zielt darauf ab, beides zu tun, und die blinden Flecken zu erkennen, die keiner der beiden Ansätze alleine adressiert.

Drei Schutzschichten

Jede löst ein anderes Problem.

Ausgabefilter

Blockiert gefährliche Ausgaben: Prompt-Injection, schädliche Inhalte, feindliche Angriffe. Wie ein Filter, der schlechte Dinge beim Ausgang abfängt.

Ethisches Gewissen

Bedenkt, ob eine Aktion richtig ist, nicht nur ob sie sicher ist. Wie ein Richter, der die Lage abwägt, bevor er eine Entscheidung trifft.

Echokammer-Erkennung

Prüft, ob Übereinstimmung echt oder nur Wiederholung ist. Wie ein Faktenprüfer, der fragt: "Haben Sie alle denselben Artikel gelesen?"

Viele kohärente Agenten

Verteilte Steuerung, keine konzentrierte Macht.

Kein einzelner Ausfallpunkt

Kleinere Agenten, jeder einzeln rechenschaftspflichtig.

Viele kleinere Agenten, jeder an veröffentlichte Prinzipien gebunden, jeder prüfbar, jeder der menschlichen Autorität unterworfen. Kein einzelnes Unternehmen oder keine einzelne Einheit kontrolliert den gesamten Stack. Je unabhängiger die Agenten, desto schwieriger ist es, dass ein einziger Fehler sich ausbreitet.

Forschungsstand

Das ist aktive Forschung. Wir kommunizieren offen darüber, was etabliert ist und was noch getestet wird.

Gut belegt

  • - Kopierte Quellen verringern echte Vielfalt
  • - KI-Modelle teilen sich Trainingsdaten-Überschneidungen
  • - Echokammern erzeugen falsches Vertrauen
  • - Unabhängige Überprüfung erkennt mehr Fehler

Wird noch getestet

  • - Genaue Messung, wie stark KI-Quellen kopieren
  • - Beste Schwellenwerte zum Markieren von Echokammern
  • - Wie gut Eingriffe das Kopieren reduzieren
  • - Wie stark dies je nach Fachgebiet variiert

Selbst ausprobieren

Selbst überprüfen.

Open Source. Offen für Prüfung.

Jede Aussage auf dieser Seite wird durch Code belegt, den Sie lesen können, durch Spuren, die Sie überprüfen können, und durch Forschung, die Sie nachschlagen können. Darum geht es.