Warum AgentBrain Core mit einer öffentlichen Research-Basis in die Beta geht

AgentBrain Core geht in eine kontrollierte Beta.

Nicht als fertiges Massenprodukt. Nicht mit großen „Wir haben alles gelöst"-Versprechen.

Sondern als früher Infrastruktur-Layer für ein Problem, das unübersehbar wird, sobald AI-Agenten über längere Zeiträume, mehrere Tools, verschiedene Modelle und in echten Workflows arbeiten sollen: Agenten brauchen mehr als reines Memory.

Sie brauchen Kontinuität.
Sie brauchen Validity.
Sie brauchen Identität.
Sie brauchen kontrollierte Rechte.
Sie brauchen Proof.

Ein Agent, der über viele Sessions, Tools und Modelle hinweg operiert, darf nicht jeden Tag bei null starten. Gleichzeitig darf er aber auch nicht einfach alte Informationen ungesehen mitschleifen und so tun, als wäre jede gespeicherte Erinnerung noch die aktuelle Wahrheit.

Genau diese Balance ist der Kern von AgentBrain. Und weil das kein reines UI-Problem ist, sondern eine fundamentale Architekturfrage, wollen wir unseren Weg dorthin von Anfang an offen dokumentieren.

Warum Research für uns wichtig ist

Viele AI-Produkte starten mit einer Demo. Eine schöne Oberfläche, ein hochoptimierter Prompt, ein beeindruckender isolierter Workflow. Das ist wichtig für den ersten Wow-Effekt. Aber für AgentBrain reicht eine Demo allein nicht aus.

Wenn wir die These aufstellen, dass long-running agents über Zeit stabiler, nachvollziehbarer und verlässlicher kontrollierbar werden müssen, dann müssen wir auch zeigen, wie wir darüber denken, wie wir testen und woran wir den Erfolg messen.

Deshalb geht AgentBrain Core mit einem transparenten wissenschaftlichen Fundament in die Beta. Zu AgentBrain gibt es bereits drei öffentliche Working Papers auf SSRN.

Diese Papers sind kein endgültiger, unumstößlicher Beweis. Sie sind keine Peer-Reviewed-Finalität und sie ersetzen auch keine echten Beta-Daten aus der Praxis. Sie sind unser öffentlicher Research-Footprint — ein nachvollziehbarer Ausgangspunkt.

Sie dokumentieren die Kernfragen, die uns von Tag eins an angetrieben haben:

Wie sollte ein autonomer Agent sein Memory strukturell organisieren?
Wie kann ein Agent über lange Zeiträume echten Kontext bewahren?
Wie lässt sich Agent-Memory gegen harte Benchmarks wie LongMemEval evaluieren?
Wie sieht eine angewandte Memory-Architektur in einem komplexen, realen Enterprise-Workflow aus?

Diese Basis ist entscheidend für unsere Beta. AgentBrain soll nicht nur in einem Blogpost gut klingen, sondern unter echten Produktionsbedingungen messbar belastbar werden.

Die drei öffentlichen Working Papers

1 · LongMemEval-M Evaluation

Agent Brain: A Biologically Inspired Memory System for Autonomous AI Agents — LongMemEval-M Evaluation

Dieses Paper fokussiert sich stark auf das Thema Messbarkeit und Benchmarking. Es untersucht AgentBrain als biologisch inspiriertes Memory-System für autonome AI-Agenten und evaluiert dessen Leistung systematisch im Kontext von LongMemEval-M.

Für die Beta ist diese Arbeit wichtig, weil sie zeigt: AgentBrain entsteht nicht aus einer rein spekulativen Produktidee. Die gesamte Architektur wird über messbare Memory-Leistung, langfristigen Kontexterhalt und überprüfbare Evaluation validiert.

Auf SSRN lesen →

2 · Head-to-Head Evaluation on LongMemEval

Agent Brain: A Biologically Inspired Memory System for Autonomous AI Agents, with Head-to-Head Evaluation on LongMemEval

Hier gehen wir tiefer in den direkten Vergleich. Der zentrale Punkt: Agent-Memory darf nicht missverstanden werden als das bloße Aufblasen des Kontextfensters („mehr Daten speichern"). Entscheidend ist, wie präzise ein System relevante Informationen über Zeit abrufen, filtern und sinnvoll anwenden kann.

Für AgentBrain Core ist das ein fundamentaler Baustein. Denn die Kategorie, die wir hier definieren, ist nicht einfaches Storage, sondern Cognitive Continuity: Ein Agent soll nicht resetten, sondern über lange Zeithorizonte hinweg stabiler und kontextbewusster agieren.

Auf SSRN lesen →

3 · Property Management Application

Agent Brain: A Biologically Inspired Memory System for Autonomous AI Agents in Property Management

Dieses Paper liefert den angewandten, praktischen Beweis. Es betrachtet AgentBrain nicht nur abstrakt, sondern in einem der dokumentenlastigsten und prozessintensivsten Bereiche überhaupt: dem Property Management.

Genau in solchen Branchen werden die Schwächen herkömmlicher Agenten-Systeme sofort sichtbar. Ein Property-Management-Agent darf nicht nur plausible Antworten generieren. Er muss den Kontext über unzählige verschiedene Fälle hinweg behalten, frühere operative Absprachen berücksichtigen und fehlerfrei mit Dokumenten, Fristen, rechtlichen Rahmenbedingungen und wiederkehrenden Prozessen umgehen.

Hier versagt ein einfacher Vector Store. In solchen Live-Workflows wird spürbar, dass ein Agent eine tiefere Struktur, Kontinuität und eine langfristige kognitive Grundlage braucht, um überhaupt vertrauenswürdig zu sein.

Auf SSRN lesen →

Was diese Papers nicht sind

Es ist mir wichtig, hier absolut sauber und aufrichtig zu bleiben.

Diese Papers bedeuten nicht, dass AgentBrain bereits jedes offene Problem der Agenten-Orchestrierung gelöst hat. Sie sind kein Ersatz für die anstehenden Beta-Tests, für echte Produktionsdaten oder externe Validierungen durch die Entwickler-Community.

Es sind Working Papers.

Das heißt: Sie zeigen unsere Flugrichtung. Sie dokumentieren unsere frühen Architekturannahmen und machen die Denkweise sowie die Evaluationslogik hinter AgentBrain transparent. Für ein kritisches Infrastrukturprodukt wie AgentBrain Core ist das der einzig richtige Weg: Vertrauen entsteht nicht durch lautes Marketing, sondern durch inspectable, nachvollziehbare Arbeit.

Kryptografisches Siegel und Passport-Interface über einem Daten-Grid — Governance-Konzept

Was wir in der Beta herausfinden wollen

Die Beta-Phase ist genau dafür da, AgentBrain Core mit echten Agenten, echten Tool-Integrationen und echten Problemen wie Memory-Drift und Kontext-Verfall in der Praxis zu testen.

Wir wollen nicht nur herausfinden, ob ein Agent Daten persistieren kann. Das ist die triviale Frage. Die härteren, architektonischen Fragen lauten:

Kann ein Agent über getrennte Sessions hinweg echte operative Kontinuität wahren?
Unterscheidet er zuverlässig zwischen aktuell gültigen Daten und abgelaufenem Kontext?
Gewichtet er eine direkte menschliche Korrektur höher als eine dichte, ältere historische Erinnerung?
Verhindert er proaktiv, dass überholte Annahmen aktuelle Entscheidungen korrumpieren?
Behält er seine Identität und Systemgrenzen bei, wenn er über völlig verschiedene Runtime Surfaces läuft?
Liefert er einen klaren Audit-Trail darüber, ob eine Aktion erlaubt, blockiert oder eskaliert wurde?

Das sind die operativen Realitäten, für die AgentBrain Core gebaut wird. Nicht für die perfekte, isolierte Sandbox-Demo, sondern für Wochen und Monate echter Nutzung.

Von Memory zu Cognitive Integrity

Unser Ausgangspunkt bleibt simpel: AI-Agenten brauchen Memory, um nützlich zu sein. Aber unmanaged Memory ist ein aktives Sicherheits- und Betriebsrisiko.

Memory ohne Validity führt unweigerlich zu selbstbewusstem Lügen.
Memory ohne Permissions führt zu unkontrollierten, riskanten Handlungen in Systemen.
Memory ohne Proof bleibt eine unprüfbare Black Box.
Memory ohne Continuity ist am Ende nur ein teurer Notizzettel.

AgentBrain Core speichert nicht einfach nur mehr Informationen. Wir bauen einen vollständigen Cognitive Integrity Layer für long-running AI agents:

Cognitive Integrity = Memory + Identity + Validity + Permissions + Cognitive State + Action Receipts + Proof

Das ist der strukturelle Rahmen, den wir in der Beta-Phase härten und validieren.

Warum wir öffentlich bauen

Wir veröffentlichen diese wissenschaftliche Basis nicht, um größer zu wirken, als wir sind. Wir veröffentlichen sie, weil AgentBrain eine völlig neue Schicht im AI-Stack definiert.

Wenn AI-Agenten den Sprung von einfachen Prompt-Antworten hin zu echten, tool-connected Workflows in kritischen Systemen machen, brauchen sie eine absolut verlässliche kognitive Infrastruktur. Sie müssen wissen, was sie erinnern, prüfen, was davon noch wahr ist, ihre aktuellen Grenzen respektieren und präzise beweisen können, warum sie gehandelt haben.

Es ist die Linie, zu der wir immer wieder zurückkehren:

Agents should not reset.
Memory should not lie.
Actions should not be unprovable.

Das ist die Arbeit hinter AgentBrain Core. Und die kontrollierte Beta ist der nächste Schritt, um diese Architektur gemeinsam mit den Entwicklern, Foundern und Agent-Buildern zu prüfen, die die Zukunft autonomer Workflows bauen.

Research Links

Alle drei Working Papers und das Autorenprofil sind öffentlich auf SSRN verfügbar:

Agent Brain: LongMemEval-M Evaluation — Auf SSRN lesen
Agent Brain: Head-to-Head Evaluation on LongMemEval — Auf SSRN lesen
Agent Brain: Property Management Application — Auf SSRN lesen
SSRN Author Page — Theshoth Sritharan — Author-Profil ansehen

— Theshoth Sritharan · Founder, AgentBrain · Sachseln, Schweiz · von einem Menschen geschrieben

Warum wir AgentBrain Core mit öffentlichen Research Papers in die Beta bringen.

Warum Research für uns wichtig ist

Die drei öffentlichen Working Papers

1 · LongMemEval-M Evaluation

2 · Head-to-Head Evaluation on LongMemEval

3 · Property Management Application

Was diese Papers nicht sind

Was wir in der Beta herausfinden wollen

Von Memory zu Cognitive Integrity

Warum wir öffentlich bauen

Research Links

Memory without validity is confident lying