Release Notes

6 min Lesezeit

OpenClaw 2026.5.4: Schnelle Stimme, Codex Audio & Performance Caching

Realtime Voice mit Gemini, Codex Audio-Support und intelligentes Workspace-Caching.

Release-Überblick

In OpenClaw 2026.5.4 dreht sich alles um Interaktion und Effizienz. Mit einer neuen Realtime-Voice-Bridge für Google Meet/Twilio,Audio-Support für Codex und Workspace-scoped Cachingreagiert OpenClaw schneller und ist angenehmer in der Bedienung.

Voice: Die Gemini Realtime Bridge

Das Spracherlebnis für Telefonie und Meetings wurde komplett überarbeitet, um Geschwindigkeit und Reaktionsfähigkeit zu maximieren.

  • Realtime Audio: Twilio-Einwahlen nutzen jetzt die Gemini Voice-Bridge mit getaktetem Streaming.
  • Keine Verzögerung mehr: Intelligente Pufferung und Barge-in-Funktionen sorgen dafür, dass der Agent sofort aufhört zu sprechen, wenn er unterbrochen wird.
  • Schnelle Interaktion: Durch das Umgehen von TwiML-Fallbacks während der Echtzeit-Sprache wird die Verzögerung zwischen Benutzereingabe und Agentenantwort drastisch reduziert.

Coding mit Stimme: Codex Audio

Coding-Agenten sind jetzt noch zugänglicher:

  • Transkriptions-Support: Aktive Codex-Chatmodelle werden nun automatisch an die OpenAI-Transkription geleitet.
  • Metadaten-Erkennung: Codex-Audio-Fähigkeiten werden jetzt korrekt in den Runtime- und Manifest-Metadaten ausgewiesen.

Performance: Workspace-Scoped Caching

Die Verwaltung großer Plugin-Bibliotheken ist dank intelligentem Caching nun viel schneller.

  • Metadaten-Snapshots: Agent-Refreshes und Plugin-Suchen können nun bestehende Snapshots wiederverwenden.
  • Vermeidung von Cold-Scans: Das System vermeidet wiederholte Scans des gesamten Plugin-Verzeichnisses auf kritischen Pfaden.
  • Startup-Vorteile: Der Gateway-Start profitiert weiterhin vom verzögerten Laden von Sidecars und Fast-Paths für Bundled-Plugins.

Control UI Verfeinerungen

Sauberer & Responsiver Chat

Das Chat-Erlebnis im Dashboard wurde für eine bessere Benutzerfreundlichkeit poliert.

  • Smart Bubbles: Aufeinanderfolgende doppelte Heartbeat-Nachrichten werden jetzt in einer einzigen Sprechblase mit Zähler zusammengefasst.
  • Besseres Filtern: Ein neuer Agent-Filter im Chat-Session-Picker hilft dabei, Konversationen schneller zu finden.
  • Geräte-Harmonie: Chat-Steuerungen und der Editor sind jetzt voll responsiv für Smartphone, Tablet und Desktop.

Windows & Netzwerk

Windows-Benutzer werden eine verbesserte Zuverlässigkeit bei der Verbindung zum lokalen Gateway feststellen. Das System bindet den Standard-Loopback-Listener nun strikt an 127.0.0.1, was Probleme mit IPv6-Dual-Stack verhindert.

Upgrade-Guide

Wer sollte aktualisieren?

  • Betreiber, die OpenClaw über Twilio oder Google Meet nutzen
  • Entwickler, die Codex verwenden und Voice-to-Text-Support wünschen
  • Power-User mit Dutzenden von installierten Plugins
  • Windows-Nutzer mit 'localhost' Verbindungsproblemen

Vorgehensweise beim Upgrade

# Update auf 2026.5.4
openclaw update

# Gateway-Status überprüfen
openclaw status --deep

Die vollständige Liste der technischen Änderungen und Mitwirkenden finden Sie auf der offiziellen Release-Seite auf GitHub.

FAQ

Wie viel schneller ist die neue Sprach-Bridge?

Die neue Gemini-gestützte Voice-Bridge für Twilio-Einwahl ist deutlich reaktionsschneller. Sie nutzt getaktetes Audio-Streaming, Pufferung mit Rückstau-Erkennung und das Leeren der Warteschlange bei Unterbrechungen (Barge-in), um Verzögerungen zu minimieren.

Was ist Codex Audio-Transkription?

OpenClaw leitet aktive Codex-Chatmodelle jetzt standardmäßig an die OpenAI-Audiotranskription weiter. Das bedeutet, dass Sie jetzt Voice-to-Text-Funktionen nutzen können, während Sie mit Codex-basierten Coding-Agenten arbeiten.

Was bewirkt das workspace-scoped Caching?

Es ermöglicht Agent-Refreshes und der Plugin-Suche, vorhandene Plugin-Metadaten-Snapshots wiederzuverwenden, anstatt langsame 'Cold-Scans' des gesamten Plugin-Verzeichnisses durchzuführen. Dies beschleunigt den Betrieb in Umgebungen mit vielen Plugins erheblich.

Was ist neu im Control UI Chat?

Die Chat-Oberfläche ist jetzt auf allen Geräten reaktionsschneller. Sie bietet zudem einen neuen Filter im Session-Picker und fasst aufeinanderfolgende doppelte Heartbeat-Nachrichten automatisch in einer Sprechblase zusammen.

Need help from people who already use this stuff?

Bauen mit OpenClaw

Von Realtime-Voice-Bridges bis hin zu intelligentem Caching – OpenClaw 2026.5.4 ist auf Geschwindigkeit ausgelegt. Werden Sie Teil unserer Community und teilen Sie Ihre Workflows.