Release-Überblick
In OpenClaw 2026.5.4 dreht sich alles um Interaktion und Effizienz. Mit einer neuen Realtime-Voice-Bridge für Google Meet/Twilio,Audio-Support für Codex und Workspace-scoped Cachingreagiert OpenClaw schneller und ist angenehmer in der Bedienung.
Voice: Die Gemini Realtime Bridge
Das Spracherlebnis für Telefonie und Meetings wurde komplett überarbeitet, um Geschwindigkeit und Reaktionsfähigkeit zu maximieren.
- Realtime Audio: Twilio-Einwahlen nutzen jetzt die Gemini Voice-Bridge mit getaktetem Streaming.
- Keine Verzögerung mehr: Intelligente Pufferung und Barge-in-Funktionen sorgen dafür, dass der Agent sofort aufhört zu sprechen, wenn er unterbrochen wird.
- Schnelle Interaktion: Durch das Umgehen von TwiML-Fallbacks während der Echtzeit-Sprache wird die Verzögerung zwischen Benutzereingabe und Agentenantwort drastisch reduziert.
Coding mit Stimme: Codex Audio
Coding-Agenten sind jetzt noch zugänglicher:
- Transkriptions-Support: Aktive Codex-Chatmodelle werden nun automatisch an die OpenAI-Transkription geleitet.
- Metadaten-Erkennung: Codex-Audio-Fähigkeiten werden jetzt korrekt in den Runtime- und Manifest-Metadaten ausgewiesen.
Performance: Workspace-Scoped Caching
Die Verwaltung großer Plugin-Bibliotheken ist dank intelligentem Caching nun viel schneller.
- Metadaten-Snapshots: Agent-Refreshes und Plugin-Suchen können nun bestehende Snapshots wiederverwenden.
- Vermeidung von Cold-Scans: Das System vermeidet wiederholte Scans des gesamten Plugin-Verzeichnisses auf kritischen Pfaden.
- Startup-Vorteile: Der Gateway-Start profitiert weiterhin vom verzögerten Laden von Sidecars und Fast-Paths für Bundled-Plugins.
Control UI Verfeinerungen
Sauberer & Responsiver Chat
Das Chat-Erlebnis im Dashboard wurde für eine bessere Benutzerfreundlichkeit poliert.
- Smart Bubbles: Aufeinanderfolgende doppelte Heartbeat-Nachrichten werden jetzt in einer einzigen Sprechblase mit Zähler zusammengefasst.
- Besseres Filtern: Ein neuer Agent-Filter im Chat-Session-Picker hilft dabei, Konversationen schneller zu finden.
- Geräte-Harmonie: Chat-Steuerungen und der Editor sind jetzt voll responsiv für Smartphone, Tablet und Desktop.
Windows & Netzwerk
Windows-Benutzer werden eine verbesserte Zuverlässigkeit bei der Verbindung zum lokalen Gateway feststellen. Das System bindet den Standard-Loopback-Listener nun strikt an 127.0.0.1, was Probleme mit IPv6-Dual-Stack verhindert.
Upgrade-Guide
Wer sollte aktualisieren?
- Betreiber, die OpenClaw über Twilio oder Google Meet nutzen
- Entwickler, die Codex verwenden und Voice-to-Text-Support wünschen
- Power-User mit Dutzenden von installierten Plugins
- Windows-Nutzer mit 'localhost' Verbindungsproblemen
Vorgehensweise beim Upgrade
# Update auf 2026.5.4
openclaw update
# Gateway-Status überprüfen
openclaw status --deepDie vollständige Liste der technischen Änderungen und Mitwirkenden finden Sie auf der offiziellen Release-Seite auf GitHub.
FAQ
Wie viel schneller ist die neue Sprach-Bridge?
Die neue Gemini-gestützte Voice-Bridge für Twilio-Einwahl ist deutlich reaktionsschneller. Sie nutzt getaktetes Audio-Streaming, Pufferung mit Rückstau-Erkennung und das Leeren der Warteschlange bei Unterbrechungen (Barge-in), um Verzögerungen zu minimieren.
Was ist Codex Audio-Transkription?
OpenClaw leitet aktive Codex-Chatmodelle jetzt standardmäßig an die OpenAI-Audiotranskription weiter. Das bedeutet, dass Sie jetzt Voice-to-Text-Funktionen nutzen können, während Sie mit Codex-basierten Coding-Agenten arbeiten.
Was bewirkt das workspace-scoped Caching?
Es ermöglicht Agent-Refreshes und der Plugin-Suche, vorhandene Plugin-Metadaten-Snapshots wiederzuverwenden, anstatt langsame 'Cold-Scans' des gesamten Plugin-Verzeichnisses durchzuführen. Dies beschleunigt den Betrieb in Umgebungen mit vielen Plugins erheblich.
Was ist neu im Control UI Chat?
Die Chat-Oberfläche ist jetzt auf allen Geräten reaktionsschneller. Sie bietet zudem einen neuen Filter im Session-Picker und fasst aufeinanderfolgende doppelte Heartbeat-Nachrichten automatisch in einer Sprechblase zusammen.
Need help from people who already use this stuff?
Bauen mit OpenClaw
Von Realtime-Voice-Bridges bis hin zu intelligentem Caching – OpenClaw 2026.5.4 ist auf Geschwindigkeit ausgelegt. Werden Sie Teil unserer Community und teilen Sie Ihre Workflows.