Heute Morgen, 6:34 Uhr. Mein Sohn muss heute Mittag zum Arzt. Also teste ich mal, ob mein Clawbot (KI-Agent) das für mich erledigen kann.

Der Auftrag

Eine Sprachnachricht über Telegram:

„Melde xxx ab der siebten Stunde krank. Grund: Arztbesuch. Hier sind die Zugangsdaten zum Elternportal.“

Das war’s. Kein Copy-Paste, kein Browser öffnen, kein Formular ausfüllen. Eine Sprachnachricht.

Was der Agent dann gemacht hat

Mein KI-Agent — er heißt Ash und läuft auf einem Hetzner-Server mit OpenClaw — hat Folgendes gemacht:

  1. Sprachnachricht transkribiert (OpenAI Whisper)
  2. Elternportal geöffnet im Headless-Browser
  3. Eingeloggt mit den Zugangsdaten
  4. Zur Krankmeldung navigiert
  5. Das richtige Kind ausgewählt (12. Klasse)
  6. Stunden gesetzt: 7. bis 11. Stunde
  7. Grund gewählt: kurzfristiger Arzttermin
  8. Screenshot zur Bestätigung geschickt
  9. Nach meinem OK: Formular abgesendet
  10. Ausgeloggt

Alles über Telegram. Per Sprachnachricht. Alle nötigen Tools hatte er sich schon vorab selbst installiert.

Das ausgefüllte Formular

Elternportal Krankmeldung — vom KI-Agent ausgefüllt (Name geschwärzt)
Das Formular, komplett vom Agent ausgefüllt — 7. bis 11. Stunde, kurzfristiger Arzttermin 

Die Bestätigung kam per E-Mail

Krankmeldung erfolgreich eingetragen — 7. Stunde bis 11. Stunde

Warum das wichtig ist

Ist eine Krankmeldung im Elternportal revolutionär? Nein. Spart es mir 3 Minuten? Ja. Ist es teuer? Ja – ich habe dafür 3$ an Tokens bezahlt an Anthropic.

Aber darum geht es nicht.

Es zeigt, was KI-Agenten wirklich können: Nicht nur Texte schreiben oder Fragen beantworten — sondern Dinge tun. Websites bedienen. Formulare ausfüllen. Prozesse abwickeln. Mein Sohn wollte gleich neue Socken haben..“kann er das auch?“ – Klar kann er das.

Das war kein Prototyp. Kein Demo auf einer Bühne. Das war heute Morgen, mein normaler Dienstag.

Wie es funktioniert

Die Technologie dahinter:

  • OpenClaw — Open-Source KI-Agent Framework
  • Telegram als Interface (Sprachnachrichten + Text)
  • Playwright Chromium als Headless-Browser
  • OpenAI Whisper für Sprache-zu-Text
  • Claude (Anthropic) als Reasoning-Engine

Der Agent läuft auf einem normalen Hetzner-Server. Keine Cloud-Magie, keine Enterprise-Lösung. Open Source.

Sicherheit

Ja, ich habe dem Agent die Zugangsdaten zum Elternportal gegeben. Das war ein bewusster Test und nicht wirklich das Pentagon. Danach habe ich das Passwort sofort geändert.

Für den produktiven Einsatz gibt es bessere Lösungen — Credential Vaults, temporäre Tokens, Session-Management. Aber für einen Proof of Concept am Dienstagmorgen? Funktioniert.

Was kommt als Nächstes?

Wenn ein Agent ein Schulformular ausfüllen kann, was kann er noch?

  • Versicherungsformulare
  • Behördengänge (online)
  • Reisebuchungen
  • Terminvereinbarungen
  • Alles, was ein Browser-Formular hat

Die Zukunft der Automatisierung ist nicht RPA mit starren Workflows. Die Zukunft ist auch nicht eine OpenAI oder Anthropic Lösung. Es sind Agenten, die verstehen was du willst — und es einfach machen und das am besten OpenSource.


Interessiert an KI-Agenten für Ihr Unternehmen? Kommen Sie zu unserem OpenClaw Meetup in München — oder schreiben Sie mir.