Das Agency-Monitoring-Problem#

Es ist 9:14 Uhr. Eine Digital-Agentur betreut 60 Client-Websites — eine Mischung aus Shopify-Storefronts, WordPress-Marketing-Seiten und ein bis zwei SaaS-Dashboards. Der On-Call-Account-Manager öffnet Slack und sieht drei rote Incident-Alerts, die über Nacht gefeuert haben.

Welche Clients gingen down? Welcher ist noch down? Hatte einer davon den „Tier 1"-SLA, in dem die Agentur 99,9% monatliche Uptime versprochen hat? Hat schon jemand die Clients informiert, oder schreiben sie gleich, warum ihr Checkout kaputt ist?

Das ist die tägliche Realität, Monitoring im Agency-Maßstab zu betreiben. Der technische Teil — URLs anpingen und Status-Codes prüfen — ist die einfache Hälfte. Die schwere Hälfte ist die Operations-Schicht obendrauf: Hunderte Domains organisieren, kontrollieren, wer in deinem Team was sehen kann, den richtigen Alert an den richtigen Menschen routen, mit Clients kommunizieren ohne auszubrennen, und das alles in etwas Profitables zu verwandeln statt in ein Support-Schwarzes-Loch.

Dieser Guide ist das Playbook. Er deckt die fünf Säulen ab, die Agenturen, die Monitoring als margenfressende Pflicht betreiben, von Agenturen trennen, die es als straffen, produktisierten Service betreiben: Domain-Organisation, Team-Zugriff, Multi-Channel-Benachrichtigungen, Client-seitige Kommunikation und Billing.

Was Agency-Monitoring anders macht#

Die meisten Uptime-Monitoring-Tools sind für ein einzelnes Team designed, das ein einzelnes Produkt betreibt. Agenturen sind das nicht. Agency-Monitoring hat seine eigenen Constraints:

Multi-Tenant-Skalierung. Du überwachst nicht 5 Endpoints — du überwachst 50 bis 500+ über viele Clients hinweg, jeder mit eigenen Subdomains, Marketing-Sites und APIs.
Verschiedene SLAs pro Client-Tier. Ein Retainer-Client, der $15.000 pro Monat zahlt, bekommt eine andere Reaktion als eine einmalige Site, die du für $200/Monat wartest. Dein Monitoring muss das widerspiegeln.
Team-Zugriffsgrenzen. Ein Junior-Entwickler sollte die drei Sites sehen, an denen er diese Woche shippt — nicht das gesamte Client-Portfolio der Agentur. Senior-Engineers und Account-Manager brauchen breitere Sichtbarkeit.
Client-seitige Sichtbarkeit. Manche Clients wollen eine Status-Page, die sie ihren Kunden zeigen können. Andere wollen einfach Bescheid bekommen, wenn etwas schiefläuft. Ein paar wollen absolute Stille und nur Quartalsberichte.
Billing-Komplexität. Manche Clients zahlen dir eine separate Monitoring-Position. Andere haben es in den Retainer eingebaut. So oder so musst du die Kosten pro Client kennen, um richtig zu pricen.
Notification-Routing. Wer wird gepiepst, wenn Client X down geht? Der PM? Der ursprüngliche Entwickler, der die Site gebaut hat? Der Client selbst? Die Antwort ist meist „kommt auf den Client und die Tageszeit an."

Wenn dein Monitoring-Tool nicht alle sechs davon modellieren kann, schraubst du sie mit Spreadsheets, Slack-Channels und Notion-Docs zusammen — und genau da bluten Agency-Operations still Marge.

Säule 1: Domain-Organisation in der Skalierung#

Das Erste, was bei 50+ Domains bricht, ist das Dashboard selbst. Eine flache Liste aller Monitore wird etwa ab 20 Domains nicht mehr nützlich. Bei 50 kannst du nicht mehr scrollen, ohne den Kontext zu verlieren.

Die Lösung ist strukturierte Organisation, und das Arbeitstier sind Tags (manchmal Folder oder Gruppen genannt, je nach Tool).

Eine Tagging-Strategie, die für Agenturen skaliert, kombiniert meist mehrere Achsen:

Nach Client. client:acme-corp, client:helio-shopify, client:beta-bank. Das ist die Hauptachse — danach werden Rechnungen, Reports und Incident-Kommunikation gruppiert.
Nach SLA-Tier. tier-1, tier-2, tier-3. Tier 1 könnte 60-Sekunden-Checks, WhatsApp-Alerts an den Founder und 24/7-Reaktion bedeuten. Tier 3 könnte 5-Minuten-Checks und ein tägliches E-Mail-Digest bedeuten.
Nach Stack. stack:wordpress, stack:shopify, stack:next-js, stack:custom-saas. Wenn ein CDN oder eine geteilte Abhängigkeit bricht, willst du sofort auf „zeig mir jede WordPress-Site, die ich hoste" filtern, ohne durch 60 Karten zu klicken.
Nach Region. region:eu, region:us, region:apac. Nützlich, wenn ein regionaler Ausfall zuschlägt und du triagieren musst, welche Clients betroffen sind.

Nova Uptime unterstützt Tags als First-Class-Konzept auf jedem Monitor, und du kannst das Dashboard nach jeder Kombination filtern. Kombiniert mit Bulk-Operationen schaltet Tagging Workflows frei, die ohne unmöglich sind: Wähl alle tier-1-Domains und stelle ihr Check-Intervall in einer einzigen Aktion auf 59 Sekunden; wähl alle client:acme-corp-Domains und pausiere das Monitoring während eines geplanten Migrations-Wochenendes.

Zwei unterschätzte Features runden das ab: Inline-Rename (damit das Dashboard „Acme — Checkout-API" zeigt statt https://api-prod-3.acme.internal), und Suche über Hunderte Domains mit Substring-Matching. Zusammen verwandeln sie ein 200-Domain-Dashboard von einer URL-Wand in etwas, das Menschen tatsächlich scannen können.

Für einen tieferen Blick darauf, wie Agenturen Nova Uptime end-to-end nutzen, sieh dir den Agency-Use-Case auf der Use-Cases-Seite an.

Säule 2: Team-Zugriffskontrolle#

Sobald deine Agentur über ein paar Personen hinauswächst, hört „jeder ist Admin auf jedem Monitor" auf, akzeptabel zu sein. Ein Junior-Entwickler sollte nicht die Macht haben, den Monitor eines kritischen Clients aus Versehen zu löschen. Ein Freelance-Contractor, der an einem Projekt arbeitet, sollte nicht deine ganze Client-Liste sehen. Ein Account-Manager sollte Incidents und Reports sehen können, aber nicht Check-Intervalle ändern dürfen.

Ein für Agenturen gebautes Monitoring-Tool braucht Role-Based Access Control mit mindestens drei Schichten:

Owner / Admin — volle Kontrolle über den Workspace, inklusive Billing.
Member mit Vollzugriff — kann auf jedem Monitor hinzufügen, editieren und Incidents auflösen.
Member mit Per-Domain-Zugriff — kann nur die spezifischen Domains sehen und bedienen, für die ihm Zugriff gewährt wurde.

Die Per-Domain-Zugriffsschicht ist die, die das Agency-Leben gesund macht. Du holst einen Freelance-Shopify-Entwickler für ein dreimonatiges Engagement; du gibst ihm Zugriff auf die vier Monitore, die für sein Projekt zählen, und sonst nichts. Wenn das Engagement endet, entziehst du den Zugriff in einem Klick — keine geteilten Passwörter, keine verwaisten Credentials.

Nova Uptime unterstützt das Einladen von Team-Mitgliedern per E-Mail, inklusive Ghost-Accounts für Leute, die noch keinen Nova-Uptime-Login haben (sie bekommen beim ersten Sign-in ein echtes Konto, mit dem Zugriff schon konfiguriert). Es unterstützt auch Read-Only-Zugriff für Stakeholder — nützlich für einen Account-Director, der Sichtbarkeit braucht, aber keine Settings umlegen sollte.

Vor allem wird jede Team-Aktion in einem Activity-Log festgehalten: wer eine Domain hinzugefügt hat, wer Monitoring pausiert hat, wer einen Incident bestätigt hat, wer den Alert-Channel geändert hat. Wenn ein Client fragt „warum wurde meine Site letzten Dienstag nicht überwacht?", kannst du mit einer zeitgestempelten Audit-Spur antworten statt mit einer Vermutung.

Säule 3: Multi-Channel-Benachrichtigungen#

E-Mail-only-Alerting war okay, als du zwei Clients hattest. Bei 50 wird deine Inbox zum Alert-Friedhof — wichtige Dinge unter Newslettern begraben, jeder Alert verschwimmt in den nächsten, der On-Call-Entwickler stellt Benachrichtigungen stumm, weil er beim Abendessen 12 davon bekommen hat.

Agency-Grade-Monitoring braucht Multi-Channel-Benachrichtigungen, geroutet nach Domain und Schweregrad:

E-Mail ist immer noch die Baseline. Nutze sie für jeden — das Team, den Account-Manager, optional den Client. Da lebt die Audit-Spur.
WhatsApp ist der richtige Channel für kritische Incidents, die sofort menschliche Augen brauchen. Founder, CTO, On-Call-Engineer — sie checken alle WhatsApp schneller als E-Mail. Nova Uptime unterstützt WhatsApp-Alerts auf jedem Plan (1 Nummer auf Free, 3 auf Pro, 5 auf Agency).
Webhooks sind die Agency-Superkraft. Pipe Alerts direkt in das vorhandene Slack, Microsoft Teams, PagerDuty oder Opsgenie des Clients. Der Client muss sich nie in dein Monitoring-Tool einloggen — Alerts tauchen in dem Channel auf, in dem er ohnehin lebt.

Das entscheidende Detail ist Per-Domain-Routing. Client A will Alerts in seinem Slack-#engineering-Channel. Client B will während der Geschäftszeiten nichts, danach SMS-eskaliert auf die On-Call-Nummer ab 18 Uhr. Client C will ein Digest-E-Mail zweimal täglich, kein Realtime-Lärm. Eine flache „send all alerts to all channels"-Konfig kann das nicht modellieren — du brauchst Per-Domain-Channel-Auswahl.

Zwei verwandte Features vervollständigen das Bild: Notification-Pause (alerts während geplanter Wartung sauber abschalten, keine Fake-Incidents zum Aufräumen) und schweregrad-basiertes Routing (eine Slow-Response-Warnung geht nur an E-Mail; ein Vollausfall triggert WhatsApp + Webhook). Richtig gemacht, bekommst du laute Signale, wenn es zählt, und Stille, wenn nicht — die einzige Art, wie Agency-On-Call langfristig überlebt.

Säule 4: Client-seitige Kommunikation#

Der größte Hebel für Agency-Monitoring ist nicht intern — er ist extern. Wie deine Monitoring-Daten zu Clients zurückfließen, definiert das Erlebnis, das sie während Incidents haben, und das Vertrauen, das sie zwischen Incidents in dich setzen.

Einbettbare Status-Widgets sind das einfachste Feature mit dem höchsten Hebel. Drop ein kleines iframe in die Site des Clients (oder eine Status-Subdomain), das die Live-Uptime der URLs anzeigt, die du für ihn überwachst. Seine Kunden hören auf, ihn zu fragen „ist die Site down?", weil sie sich selbst informieren können. Sein internes Team hört auf, dich anzu-slacken „läuft was schief?", weil sie grüne Häkchen sehen können. Nova Uptime unterstützt einbettbare Widgets auf jeder Domain — Token-basiert, Origin-verifiziert und per-Domain konfigurierbar.

Public Share-Links sind die leichtere Alternative — eine URL, die du in eine Client-E-Mail einfügen kannst, wenn ein Incident läuft. Sie klicken, sie sehen den Live-Status, und du hast ein 30-minütiges Hin und Her durch einen 15-Sekunden-Link ersetzt.

Wöchentliche automatisierte Reports verwandeln die langweilige aber wichtige „ist alles oben geblieben?"-Frage in eine wiederkehrende E-Mail, die in der Inbox des Clients landet, ohne dass du etwas tust. Für Tier-1-Clients ist das der konkreteste Proof-of-Value, den die Agentur den ganzen Monat liefert.

Failure-Screenshots zählen mehr, als Leute erwarten. Wenn eine Site down geht, ist ein Screenshot der tatsächlichen Fehlerseite (oder des Timeouts, oder des falschen Inhalts, der ausgeliefert wird) drastisch nützlicher als ein Status-Code. Clients verstehen Bilder. Clients streiten mit Status-Codes.

Das zu vermeidende Anti-Pattern: den Client deinen Monitoring-Agenten auf seinem Server installieren lassen. Tu's nicht. Bleib bei URL-basiertem externem Monitoring — es ist schneller im Onboarding, kann seinen Stack nicht zerschießen, und funktioniert gleich, ob die Site auf seinem billigen Shared-Host oder deiner Premium-Infra liegt.

Säule 5: Billing & Profitabilität#

Monitoring sollte der Agentur Geld einbringen, nicht verlieren. Die Mathematik ist einfach, aber du musst sie machen.

Die Pricing-Tiers von Nova Uptime sind genau auf diese Frage zugeschnitten:

Free — 5 Domains. Nützlich für Prospecting und Testen mit kleinen Clients.
Pro — $99/Jahr, 100 Domains. Der richtige Tier für Agenturen mit 20–80 Client-Sites.
Agency — $699/Jahr, 1.000 Domains. Der richtige Tier, sobald du jenseits von 100 Client-Domains bist oder WhatsApp-Alerts auf 5 Nummern, max API-Zugriff und die höchste Check-Frequenz willst.

Domain-Add-ons (+10 / +50 / +100) lassen dich wachsen, ohne ein Tier-Upgrade zu erzwingen — nützlich, wenn du bei 105 Domains bist und nicht direkt auf Agency springen willst.

Die Billing-Frage, die jede Agentur beantworten muss, ist: Monitoring in den Retainer einbauen oder separat berechnen? Bündeln ist operativ einfacher und fühlt sich für den Client großzügig an. Separat als Position zu berechnen ($25–$100/Site/Monat ist die typische Spanne) ist profitabler, gibt dir einen Grund, quartalsweise über Uptime zu reden, und lässt Clients in einen Service-Tier hineinwählen. Die meisten Mid-Market-Agenturen landen bei einem Hybrid: Monitoring in Tier-1-Retainer eingebaut, separat berechnet für Einmal-Projekte.

Was auch immer du wählst, die wöchentlichen Reports (oben erwähnt) verdoppeln sich als Billing-Artefakte. Sie sind der Beweis für den SLA, den du lieferst — und der einfachste Beleg, den du an ein Renewal-Gespräch anhängen kannst. Für eine tiefere Kostenaufschlüsselung sieh dir den Uptime-Monitoring-Kostenvergleichs-Guide an.

Reales Agency-Workflow-Beispiel#

Hier ein Tag im Leben eines Agency-Operations-Leads, der Monitoring auf Nova Uptime betreibt:

9:00. Dashboard öffnen. Nach tier-1-Tag filtern. Drei Incidents über Nacht — zwei auto-resolved, einer noch in Untersuchung. In den offenen Incident klicken, den Failure-Screenshot ansehen, dem PM des Clients eine einzeilige Update-Nachricht plus den Public-Share-Link schicken.
9:15. Wöchentliche automatisierte Reports für alle tier-1-Clients triggern. Jeder Client bekommt eine saubere E-Mail, die seine Wochen-Uptime, Incident-Count und SLA-Status zeigt. In einer Aktion erledigt.
11:00. Neues Client-Onboarding-Kickoff. Die Agentur hat gerade einen Shopify-Retailer mit 12 Domains unterschrieben (Hauptshop + 8 Country-Subdomains + 3 Marketing-Pages). Bulk-Import aller 12 per CSV in einem Rutsch (Nova Uptime unterstützt Bulk-Import bis zu 100 auf einmal). Mit client:retailer-x und tier-2 taggen. Den CTO des Clients als Team-Mitglied mit Read-Only-Zugriff auf nur diese 12 Monitore einladen.
14:00. Slack-Pings: Ein Webhook feuert vom Monitor client:beta-bank api-checkout mit langsamen Response-Zeiten. Niemand ist down — noch nicht — aber die Warnung gibt dem On-Call-Engineer 20 Minuten zur Untersuchung, bevor Kunden es bemerken. Datenbank unter Last, Autoscaler springt an, Problem gelöst.
16:30. Tier-3-Client mailt: „Wir deployen morgen früh ein neues Theme, kannst du Alerts pausieren, damit mein Team nicht durch False Positives geweckt wird?" Monitoring auf seinen drei Domains pausieren, geplantes Auto-Resume um 11 Uhr am nächsten Tag.
17:30. Tagesende. Das Activity-Log hat 47 Einträge — jede Team-Aktion, jeder Alert, jede Domain-Änderung — sauber zeitgestempelt. Falls morgen ein Client fragt, was heute passiert ist, ist die Antwort einen Filter entfernt.

Das ist ein realer Agency-Dienstag. Nichts davon verlangt Heldentum; es verlangt das richtige Tool richtig konfiguriert.

Setup-Checkliste für Agenturen#

Wenn du bei Null anfängst (oder von einem Tool migrierst, das an seine Grenzen stößt), hier die Reihenfolge der Operationen:

Den richtigen Plan abonnieren. Pro für unter 100 Domains, Agency für über 100 oder wenn du 5 WhatsApp-Nummern brauchst. Siehe Pricing.
Client-Domains bulk hinzufügen. CSV-Import bewältigt bis zu 100 auf einmal. Füge sie nicht eine nach der anderen hinzu.
Domains nach Client und SLA-Tier taggen. Nutze eine konsistente Naming-Convention (client:slug, tier-N, stack:name). Dokumentier sie in deinem Team-Wiki.
Team-Mitglieder mit passendem Zugriff einladen. Owners + Admins für Senior-Staff, Per-Domain-Zugriff für Junior-Entwickler und Contractors, Read-Only für Account-Manager.
WhatsApp-Alerts für die Senior-On-Call-Rotation konfigurieren. Nicht für alle aktivieren — das verfehlt den Zweck.
Webhook-Integrationen zu jedem Slack/Teams/PagerDuty der Clients einrichten. Das ist die Integration mit dem höchsten Impact.
Status-Widgets auf jeder Status-Page oder jedem Dashboard der Clients einbetten. Bonuspunkte: Link zu deiner Agentur im Widget.
Wöchentliche Reports für alle Tier-1- und Tier-2-Clients planen. Automatisieren, nicht komponieren.
Deinen Incident-Response-Prozess dokumentieren. Wer bestätigt? Wer kommuniziert? Wer löst auf? Wer schreibt das Post-Mortem? Einmal aufschreiben, für immer befolgen.

Für breitere Monitoring-Strategie jenseits von Uptime kombiniere das mit dem SaaS-Uptime-Monitoring-Guide und der Multi-Region-Monitoring-Übersicht. Und vergiss nicht, dass Uptime nur die halbe Geschichte ist für Agenturen, die Clients betreuen, die E-Mail nutzen — lass den Free E-Mail-Health-Checker bei jedem neuen Client beim Onboarding laufen, um SPF-, DKIM- und DMARC-Fehlkonfigurationen abzufangen, bevor sie den Client Zustellbarkeit kosten.

Fazit#

Agency-Monitoring ist ein Operations-Problem, getarnt als technisches. Die Pings sind einfach; die Menschen, die Clients und das Billing sind, wo es lebt oder stirbt. Bring die fünf Säulen richtig — Organisation, Zugriff, Benachrichtigungen, Client-Kommunikation und Billing — und Monitoring hört auf, eine Margen-Senke zu sein, und wird zu einem der verteidigbarsten Teile deines Service.

Probier den Nova Uptime 30-Minuten-Trial ohne Anmeldung, oder spring direkt in einen Pro- oder Agency-Plan und bulk-importiere deine Client-Domains heute. Jedes Feature in diesem Guide kommt in den Standard-Plänen — keine Add-ons, keine Überraschungen. Sieh dir die volle Feature-Liste an, um zu sehen, was enthalten ist.

Agency-Uptime-Monitoring: 50+ Client-Domains managen, ohne den Verstand zu verlieren

Das Agency-Monitoring-Problem#

Was Agency-Monitoring anders macht#

Säule 1: Domain-Organisation in der Skalierung#

Säule 2: Team-Zugriffskontrolle#

Säule 3: Multi-Channel-Benachrichtigungen#

Säule 4: Client-seitige Kommunikation#

Säule 5: Billing & Profitabilität#

Reales Agency-Workflow-Beispiel#

Setup-Checkliste für Agenturen#

Fazit#

Verwandte Lektüre#

Monitor Your Website Before It Goes Down

Verwandte Artikel

Uptime-Monitoring für Digitalagenturen: Mehrere Kundenwebsites skalierbar verwalten

Uptime-Monitoring für SaaS-Anwendungen: Der komplette Leitfaden zur Infrastruktur-Gesundheit

Domain-Monitoring mit SSL-Alerts: Der komplette 2026er-Setup-Guide