Ein Xiaomi-Smartphone, Termux aus F-Droid und ein paar Python-Scripts — mehr braucht es nicht für einen vollständig autonomen AI-Agenten, der rund um die Uhr läuft. Kein Homelab, kein Cloud-Server, kein Raspberry Pi. Nur ein Handy in der Hosentasche.
Was als Experiment begann, ist mittlerweile ein produktiver Stack: Mein Smartphone überwacht meinen Webserver, generiert Content-Entwürfe, analysiert Server-Logs, pusht WordPress-Drafts per REST-API und schickt mir Benachrichtigungen wenn etwas schiefgeht. Alles lokal, alles automatisiert, alles unter meiner Kontrolle.
Die Architektur: Fünf Schichten auf einem Gerät
Der Agent besteht aus fünf Schichten, die alle 30 Minuten als Cron-Job durchlaufen:
Schicht 1 — Senses: Ein Bash-Script liest über die Termux-API den kompletten Gerätezustand aus: Akkustand, Speicherauslastung, CPU-Temperatur, WiFi-Status, laufende Dienste. Alles landet als JSON in einer Datei, die der Agent als Entscheidungsgrundlage nutzt.
Schicht 2 — Analytics: Ein Python-Script zieht frische Daten aus zwei Quellen. Die WordPress REST-API liefert Post-Statistiken: Wie viele Artikel wurden diese Woche veröffentlicht, wie viele Entwürfe liegen bereit, was war der letzte Post. Parallel wird die Server-Telemetrie ausgewertet — ein Cron-Job sammelt alle 15 Minuten die aktuelle Server-Last von Hetzner. Daraus berechnet der Agent Trends, Durchschnitte und generiert automatisch Insights wie „Server-Last steigt“ oder „Content-Pipeline stockt“.
Schicht 3 — Brain: Das Herzstück. Ein Python-Script entscheidet basierend auf Uhrzeit, Akkustand, Server-Last und Content-Pipeline was zu tun ist. Morgens gibt es ein Analytics-Briefing per Notification. Mittags werden Social-Media-Posts aus einer vorbereiteten Hook-Library gezogen und per Clipboard bereitgestellt. Abends generiert der Agent Blog-Outlines — aber nur wenn die Pipeline es braucht. Hat die Woche schon genug Posts, wird übersprungen.
Schicht 4 — Publisher: Fertige Blog-Entwürfe werden automatisch als WordPress-Drafts per REST-API auf den Server gepusht. Eine Notification mit Direktlink zum WP-Admin macht das Review zum Ein-Tap-Vorgang.
Schicht 5 — Watchdog: Alle fünf Minuten prüft ein separates Script ob der LLM-Server und andere Dienste noch laufen. Bei Crash wird automatisch neu gestartet und ein Eintrag ins Log geschrieben.
Das LLM: Lokal, klein, ausreichend
Im Hintergrund läuft ein llama-server mit einem Qwen 2.5 1.5B Modell in Q4-Quantisierung. Auf dem Snapdragon 7s Gen 3 liefert das etwa 8-12 Tokens pro Sekunde. Für Content-Generierung ist das zu schwach — die Qualität kleiner Modelle reicht nicht für veröffentlichungsfähige Texte. Aber für Routing-Entscheidungen, kurze Zusammenfassungen und Analytics-Auswertungen ist es völlig ausreichend.
Die Lösung: Social-Media-Content kommt aus einer vorab geschriebenen Hook-Library mit über 40 Posts, sortiert nach Themen-Clustern. Der Agent wählt passende Hooks aus, rotiert über Plattformen und vermeidet Wiederholungen. Das LLM wird nur dort eingesetzt wo seine Stärke liegt — nicht dort wo es versagt.
Der tägliche Rhythmus
So sieht ein typischer Tag des Agenten aus:
Alle 5 Minuten: Watchdog checkt ob alle Dienste laufen.
Alle 15 Minuten: Telemetrie-Collector zieht die aktuelle Server-Last von Hetzner.
Alle 30 Minuten: Brain-Cycle — Senses lesen, Analytics auswerten, Content-Entscheidungen treffen, Notifications pushen.
06:00: Sovereign SOC — nächtliche Sicherheitsanalyse der Server-Logs.
22:00: Auto-Publisher — wartende Blog-Entwürfe werden als WordPress-Drafts gepusht.
23:00: Lagebericht — Markdown-Report mit System-Status, Server-Daten, Content-Pipeline und Brain-Aktivität.
00:00: Self-Analyse — der Agent wertet sein eigenes Verhalten aus.
Was es kostet
Die Hardware war schon da — es ist mein normales Smartphone. Termux ist kostenlos aus F-Droid. Die Python-Packages sind Open Source. Der Hetzner-Account für neobild.de kostet 2,75 € im Monat. Laufende Kosten für den Agenten selbst: 0 €. Kein API-Abo, kein Cloud-Compute, keine monatliche Rechnung.
Was ich gelernt habe
Kleine Modelle sind gut für Entscheidungen, schlecht für Content. Cron-Jobs sind zuverlässiger als fancy Orchestrierungs-Frameworks. Termux-API gibt dir mehr Zugriff auf dein eigenes Handy als die meisten Apps. Und der wichtigste Punkt: Autonomie bedeutet nicht Perfektion. Es bedeutet, dass das System läuft ohne dass ich alle fünf Minuten draufschauen muss.
Der Agent ist nicht perfekt. Er generiert keinen Pulitzer-würdigen Content und er wird keinen menschlichen Social-Media-Manager ersetzen. Aber er hält den Laden am Laufen, während ich andere Dinge tue. Und er läuft auf einem Gerät das ich sowieso immer dabei habe.
Dieser Artikel wurde in Termux auf einem Android-Smartphone verfasst und per REST-API als WordPress-Draft veröffentlicht. Der Agent, über den hier geschrieben wird, hat bei der Erstellung dieses Drafts mitgewirkt.