Frank Carius

Autor: Frank Carius
Enterprise Architect / Partner – auf LinkedIn vernetzen

Jahrzehntelang haben Exchange Administratoren ihre lokalen Server mit einem klassischen Netzwerk Monitoring überwacht. Mit der steigenden Bedeutung von Cloud-Services verändern sich jedoch die Anforderungen ständig. In diesem Blogartikel zeigen wir Ihnen, welchen Ansatz Sie für Ihr Exchange Online Cloud Monitoring wählen müssen, um Ihre Anwender optimal in Ihrem Arbeitsalltag zu unterstützen.

Klassisches Monitoring als Ausgangspunkt

Wer bislang einen Exchange Server selbst betrieben hat, war gut beraten diesen auch zu überwachen. Dazu gehörten klassisch die folgenden vier Aspekte:

  1. Numerische Werte wie CPU-Last, RAM-Auslastung, Füllgrad der Festplatten
  2. Überwachungen der gestarteten Dienste und Erreichbarkeit aus dem Netzwerk
  3. Funktionsüberwachung durch synthetische Transaktionen, Anmelden per EWS, Versand und Empfang von Roundtrip-Mails
  4. Überwachung des Eventlogs auf Fehler und Warnungen

Dazu wurde im Serverraum Lösungen wie zum Beispiel Nagios, Icinga und PRTG installiert, mit denen neben Exchange auch andere Server und das Firmennetzwerk überwacht werden können. Der individuelle Desktop Client wurde eher per Inventarisierung und Softwareverteilung gemanagt, aber nicht direkt überwacht. Warum dies jedoch besonders mit der steigenden Verbreitung von Cloud-Services für Ihr Netzwerk Monitoring wichtig ist, lernen Sie im Beitrag „Aktualisieren Sie Ihr herkömmliches Netzwerk Monitoring für die Cloud“ auf unserem Blog.

Herausforderungen beim Cloud Monitoring

Fast alle klassischen Überwachungsansätze schlagen fehl, wenn es um Exchange Online oder andere Cloud-Services geht. Die Server werden vom Dienstleister, hier Microsoft, betrieben und sind für die Firma nicht mehr über das klassische Monitoring erreichbar. Eine Überwachung der CPU-Last eines einzelnen oder aller Server ist in einer Cloud Umgebung schlicht nicht möglich, da der Betreiber viele Server hinter Loadbalancern versteckt. Auch Eventlogs, Festplatten etc. sind nicht mehr erreichbar. Es können nur noch die Erreichbarkeit der jeweiligen Dienste überprüft und synthetische Transaktionen ausgeführt werden.

Wenn Sie bislang Ihre Server im Rechenzentrum mittels eigener Agenten im gleichen Rechenzentrum überwacht haben, dann können diese Agenten nun mit dem Service in der Cloud sprechen. Allerdings müssen die Agenten dazu erst einmal zur Cloud kommen und dort eine sinnvolle Adresse ansprechen, welche auch zeitnah eine Antwort liefert. Zudem darf das Cloud Monitoring nicht so ausgelegt sein, dass der Cloud-Anbieter vielleicht eine DoS-Attacke vermutet. Im besten Fall werden Ihre Anfragen als Konsequenz nur gedrosselt. Im schlimmsten Fall würden Ihre Anfragen anhand der IP-Adresse blockiert werden. Gleichzeitig würden die regulären Zugriffe über die gleiche IP-Adresse auch unterbunden werden.

Sie müssen daher andere Wege wählen, um einen qualifizierten Status der genutzten Cloud-Services zu ermitteln und in Ihrem Monitoring einzubinden.

Exchange Online und synthetische Transaktionen

Anhand von Exchange Online lässt sich ein weiterer Irrglaube gut widerlegen. Viele Firmen überwachen die Funktion Ihrer Umgebung zum Beispiel durch regelmäßig versendete Mails, die innerhalb einer Frist auch wieder abgerufen werden können. Wenn die Testnachricht ausbleibt, dann könnte eine Störung innerhalb der Kette vorliegen. Dieses Vorgehen macht bei Exchange Online allerdings keinen Sinn.

Mittels Exchange PowerShell können Sie für jede Mailbox den „Homeserver“ und die Mailboxdatenbank auslesen:

Powershell

Die beiden Werte enthalten Hinweise auf Standorte, Servernamen, Datenbanknamen, Clustergruppen und Pod-Gruppen, die wir weiter auswerten können:

Aufschlüsselung von Servername und Datenbanken DE

Aus einer realen Kundenumgebung mit ca. 35.000 Postfächern haben wir so ca. 28.000 Datenbank auf über ca. 7000 Server in fast 500 DAGs ermittelt, die über 9 Standorte in 33 Datacentern verteilt waren. Und das waren nur die Postfachserver in Europa. Der Zugriff der Clients über zusätzliche CAFE-Server, die eine Anfrage erst zum richtigen Datacenter und dann zum Postfachserver routen, ist hier noch gar nicht enthalten.

Die Überwachung einer einzelnen Testmailbox liefert dabei jedoch keine Aussagekraft bei der Menge und Verteilung der Server und Dienste. Lesen Sie mehr über EXO Mailboxserver Insight auf meinem msxfaq-Blog.

Einbindung der Statusabfrage per Graph in Ihr Cloud Monitoring

Nur weil Ihre bestehende Überwachung nicht mehr geeignet ist, müssen Sie nicht blind bleiben. Microsoft stellt Ihnen im Adminportal unter “health overview” und “service health” und  einen Status bereit, den Sie auch per Microsoft Graph abfragen und in Ihr Cloud Monitoring übernehmen können. So können Sie die Funktion der Cloud-Services passgenau für Ihren Tenant indirekt mit überwachen. Lernen Sie generell mehr über die Service Communications API auf Microsoft Learn.

Verbindungsüberwachung vom Client zum Cloud-Service

Nun kann es immer noch vorkommen, dass die Cloud keinen Fehler berichtet, aber Ihre Anwender sich über eine schlechte Nutzbarkeit des Diensts beschweren. Auf den Weg zwischen Ihrem Client und dem Cloud-Service gibt es immer noch viele Stolperstellen, die weder durch Ihr lokales Monitoring noch den Cloud-Anbieter überwacht werden.

Cloud Monitoring vs. traditional network monitoring DE

Kommunikationswege in der Cloud und deren Überwachung.

Bei optimierter Konfiguration durchlaufen die Pakete Ihrer User im Homeoffice nicht einmal Ihr Firmennetzwerk auf dem Weg in die Cloud. Selbst die Systeme in Ihrer Firma verlassen nach wenigen Stationen Ihr verwaltetes Netzwerk.

Für verlässliche Aussagen müssen Sie Ihr Monitoring anpassen, um Probleme zu erkennen. Idealerweise wird die Verbindung zu den Cloud Services aus Sicht der Anwender zum Beispiel mit Rimscout überwacht, wie im Bild durch die blauen Pfeile. Eine Überwachung durch Ihr bisheriges Monitoring, fokussiert auf die Server, dargestellt durch die grünen Pfeile im Bild, ist möglich, aber erfasst immer nur eine Teilmenge. Die wenigsten Ihrer Endanwender arbeiten jedoch im Serverraum und letztlich zählt, was bei den Clients Ihrer User ankommt.

Nahtloses Cloud Monitoring mit Rimscout

All diese Überlegungen waren Auslöser, mit Rimscout genau diese Lücke zu füllen. Mit einem End-to-end Monitoring wie Rimscout können Sie die Verbindungen zu Cloud Services wie Exchange Online aus Sicht Ihrer Anwender im Blick überwachen.

Durch einen kleinen Agenten auf den Endgeräten Ihrer Nutzer werden die Erreichbarkeit und Performance verschiedener Services ermittelt. Sie können diesen Rimscout Client problemlos auf jedem Windows Endgerät installieren. Er registriert sich automatisch an der richtigen Instanz, bezieht die vorgesehen Aufgaben aus den definierten Test-Sets und meldet die Ergebnisse an Ihr Rimscout-Portal zur Auswertung.

Über dieses Portal können Sie die Ergebnisse auswerten und sogar in Ihr Netzwerk Management System übernehmen. So können Sie nicht nur einen Überblick gewinnen, an welchem Standort Anwender vielleicht Probleme haben, sondern auch genau ermitteln, ob diese im lokalen Netz liegen, der Konfiguration des Endgeräts geschuldet sind oder doch in der Verantwortung ihres Cloud-Providers liegen.

Cloud Monitoring with Rimscout

Der Ausfall von Outlook lässt sich durch die grauen Balken auf dem Screenshot gut erkennen. Jeder Standort kann den Service nicht erreichen und dieses Muster lässt sich auch in den einzelnen Clients wiederfinden.

Testen Sie Rimscout in Ihrer Umgebung.
Sie suchen ein effizientes Cloud Monitoring z.B. für Exchange Online? Testen Sie ganz einfach den vollen Funktionsumfang von Rimscout: