
Autor: Frank Carius
Enterprise Architect / Partner – auf LinkedIn vernetzen
Die meisten Firmen betreiben heutzutage mehr oder weniger professionell eine lokale Überwachung der Dienste, des Netzwerks und der Bandbreite. Das übergeordnete Ziel der Administratoren besteht in der effizienten Identifikation und Behebung von Betriebsstörungen oder Leistungsbeeinträchtigungen. Häufig sind jedoch die Performance und die Erreichbarkeit der jeweiligen Anwendungen beim einzelnen Anwender ein blinder Fleck im herkömmlichen Monitoring. Lernen Sie in diesem Blogartikel, wie sich Rimscout vom klassischen Netzwerk Monitoring unterscheidet und wieso der Anwender, vor allem im Cloudumfeld, zunehmend an Bedeutung gewinnt.
Klassisches Netzwerk Monitoring mit Icinga, Nagios, PRTG und SNMP
Im Kontext des klassischen Netzwerkmonitorings sind Lösungen wie Nagios, Icinga, PRTG und WhatsUp Gold stark verbreitet und so in vielen Unternehmen vertreten. Fast alle Produkte nutzen ein zentrales System, um Konfigurationen zu verteilen, Ergebnisse einzusammeln und zu visualisieren. Dazu werden entsprechende Agenten an jedem Standort oder an definierten externen Orten zur lokalen Überwachung oder Prüfungen anderer Systeme verteilt. Diese Konfiguration ist jedoch statisch und nicht für die flexible Arbeit an verschiedenen Standorten mit vielen Clients ausgelegt, was in der heutigen Zeit des Remote Work jedoch immer wichtiger wird.
Netzwerk Monitoring Tools führen meist einmal pro Minute verschiedene Checks und Abfragen durch, um den aktuellen Status des Netzwerkes zu erfassen. Betrachtet man beispielsweise die Abfragen eines lokalen Exchange Servers können generell zwei Kategorien abgefragt werden:
So kann, in diesem Beispiel, das Exchange-Team bei Problemen alarmiert werden und auch das Netzwerk-Team kann allgemeine Aussagen zur Belastung des Netzwerks und insbesondere des Internet-Ausgangs treffen.
Haben Sie die Clients Ihrer Anwender im Fokus?
Allerdings gibt es wenige Netzwerk Monitoring Lösungen, die auch den individuellen Client direkt in die Überwachung mit einbeziehen. Wie schnell, zuverlässig und stabil der jeweilige Anwender mit dem bereitgestellten Service arbeiten kann, merken die Fachverantwortlichen erst im Nachgang und indirekt über die Anzahl der Support-Tickets. Dies gilt besonders für Mitarbeiter im Homeoffice, welche über das Internet und gegebenenfalls über einen zusätzlichen VPN-Tunnel verbunden sind.
In vielen Fällen würde mehr Klarheit herrschen, wenn auch die Performance und Erreichbarkeit beim Anwender aktiv ermittelt und überwacht werden würde. Allerdings sehen sich hier die meisten Netzwerk-Administratoren nicht in der Pflicht und auch viele Exchange Administratoren beschränken sich auf Ihre Server und scheuen den direkten Kontakt mit dem Anwender. So bleibt die eigentliche Performance beim Anwender oft ein blinder Fleck in vielen Unternehmen.
Cloud Services verändern die Anforderungen an ein Netzwerk Monitoring
Mit der Nutzung von Cloud Services, wie zum Beispiel Exchange Online, verschiebt sich der Fokus des Monitorings deutlich. So entfällt nicht nur der lokale Exchange Server als Überwachungspunkt, sondern auch die Verbindungswege ändern sich bei einem „Cloud“-Netzwerkdesign.
- Bürobenutzer umgehen den lokalen Exchange Server und verbinden sich mit der Cloud
- Niederlassungen mit lokalem Breakout umgehen das bisher genutzte WAN und verlassen das Firmennetzwerk vor Ort
- Homeoffice-Benutzer verbinden sich direkt zum Service in der Cloud
Die logische Konsequenz aus dieser Änderung: Das bisher genutzte Netzwerk Monitoring muss entsprechend angepasst werden, damit Sie auch weiterhin zuverlässig erkennen können, wo genau ein Problem vorliegen könnte. Natürlich kann niemand „das Internet“ in seiner Gänze überwachen und kaum ein Provider lässt sich tief in die Karten schauen und erlaubt den SNMP-Zugriff auf die Router. Trotzdem sind Sie als IT-Verantwortlicher nicht zur Untätigkeit verdammt, denn Sie können durchaus aktiv überwachen und messen. Allerdings etwas anders als mit Ihrem klassischen Netzwerk Monitoring, bei welchem die Bandbreite oftmals eine der wichtigsten Metriken ist.
Latenzzeit statt Bandbreite – Warum Ihr Monitoring einen neuen Maßstab braucht
Im Vergleich zur Bandbreite spielt die Latenzzeit eine immer größere Rolle, wenn es um die Leistung und Effizienz digitaler Systeme geht. Die Bandbreite gibt die Menge an Daten an, die für eine Verbindung transportiert wird. Die Latenzzeit bezieht sich jedoch auf die Zeit, die benötigt wird, um eine Anfrage zu senden und eine passende Antwort zu erhalten.
Die Werte einer Bandbreitenüberwachung an ihren Internetzugängen sind also nur bedingt aussagekräftig, denn der Weg vom Client zum Service ist in einem „Cloud“ Netzwerkdesign deutlich länger. Wenn eine Störung auf dem Übertragungsweg auftritt und so die Pakete gar nicht schnell genug zurückkommen können, dann wird die vorhandene Bandbreite gar nicht genutzt. Warum die vorhandene Bandbreite nicht genutzt wird, können Sie nicht durch die Messung an der Schnittstelle erkennen und der zu niedrige Wert könnte Sie in falscher Sicherheit wiegen. Der Admin wird das Netzwerk als Problemursache so ausschließen, obwohl er nur einen Teil der Situation sicher mit Daten belegen kann.
Statt einer reinen Bandbreitenbetrachtung sollten Sie die Latenzzeit von geeigneten Messpunkten hin zum genutzten Cloud-Service überwachen. Die meisten Dienste lassen sich zumindest per PING oder HTTPS auch anonym ansprechen und die jeweilige Antwort erlaubt Ihnen direkt drei zuverlässige Aussagen:
Erst die Überwachung dieser drei Aspekte liefert Ihnen fundierte Daten für eine erfolgreiche Analyse, denn eine reine Betrachtung der genutzten Bandbreite an Ihrem Übergang zum Internet reicht dazu nicht aus. Bleiben Sie gespannt, bald können Sie mehr zu dem Thema Latenzzeit-Monitoring auf unserem Blog lesen.
Eine höhere Abdeckung für bessere Messergebnisse
Klassische Netzwerk Monitoring Tools sind also optimal für die Überwachung von Diensten (Up/Down) und können per SNMP auch eigene Netzwerkdaten in regelmäßigen Abständen abfragen. Meistens erfolgt eine Abfrage jede Minute. Die daraus resultierende Frage ist nun, wie häufig müssen Sie die Latenzzeit messen.
Je häufiger Sie eine Probe nehmen, desto lückenloser wird die Überwachung und Sie können auch kurzweilige Probleme auf der Verbindung protokollieren. Vor allem Audio- und Video-Verbindungen sind sehr störungsanfällig und benötigen so eine höhere Abdeckung mit mehreren Messungen pro Minute, um Aussetzer korrekt festzustellen. Microsoft Teams sendet beispielsweise während einer Audiokonferenz ca. 50 Pakete/Sekunde und ca. 100 kbit/Sek. pro Teilnehmer und auch Outlook wird mit 4-8 kbit/Sek angegeben. Selbst wenn Sie nur 0,1 % Ihrer Bandbreite für das Monitoring der Latenzzeit opfern, können Sie problemlos Prüfpakete im Sekundentakt oder noch kürzer zur Überwachung einsetzen.
Durch die engmaschige Überwachung bekommen Sie als Ergebnis eine sehr genaue Anzeige von selbst kurzen schlechten Phasen, die Ihre Anwender ansonsten als Problem melden und von Ihnen bislang unbemerkt geblieben sind. Idealerweise prüfen Sie diese Verbindungen jedoch nicht von einem Monitoring-Server im Serverraum, wie beim klassischen Netzwerk Monitoring, sondern direkt vom Client selbst zur Cloud.
Überwachen Sie den Zustand Ihrer Dienste mit den richtigen Tools und APIs
Gehen Sie davon aus, dass die Cloud-Anbieter auch verschiedene Telemetrie-Daten erheben. Leider stellen die meisten Anbieter keine oder nur rudimentäre Daten bereit und diese decken auch nicht alle Clients und Zeiträume ab. So prüft zum Beispiel der OneDrive Client und auch Outlook regelmäßig die Verbindung mittels „TraceRoute“ und meldet die Daten zu Microsoft. In beiden Fällen bleiben Sie als Kunde dieser Dienste jedoch (noch) blind. Allein bei Microsoft Teams kann ein Teams-Administrator im Portal eine Teilmenge der Telemetriedaten einsehen. Doch reicht dies aus?
Allerdings können und sollten Sie wiederum nicht versuchen, die Funktion eines Cloud-Service direkt zu überwachen. Exchange Online betreibt zum Beispiel sehr viele Server für den Clientzugriff und sicher noch mehr Postfachserver für Datenbanken, so dass kaum zwei Anwender der gleichen Firma auf dem gleichen Server arbeiten. Ein synthetischer Funktionstest kann daher maximal große Schadensfälle ermitteln. Besser ist es hier, die angebotenen APIs zu nutzen, um den Health-Status eines Service in das eigene Monitoring zu überführen. Mehr zu dem Thema lernen Sie bald in unserem Blogartikel über das richtige Monitoring von Exchange Online.
Die neue Art des Netzwerk Monitorings mit Rimscout
Wir wissen nun, dass Sie Ihr klassisches Netzwerk Monitoring für Cloud-Services anpassen müssen und warum eine Datenerhebung aus einem Serverraum nur bedingt nützlich ist. Erst die Überwachung vom einzelnen Client zu den vom Anwender genutzten Cloud-Anwendungen liefert ein lückenloses und aussagekräftiges Bild Ihrer Netzwerk-Umgebung. So können die Performance- oder Verbindungsprobleme der Anwender schnell gefunden und lokal eingegrenzt werden. Dies stellt speziell im Homeoffice eine wichtige Unterstützung dar.
Aber auch Ihre selbst betriebenen Dienste sind wie ein „Cloud Service“ zu sehen, der nur im eigenen Datacenter steht und bislang nie von einem Client aus erfasst wurde. Zusätzlich nutzen auch Homeoffice-Anwender lokale Dienste, wie zum Beispiel VPN-Server, Terminal Server oder Branchenanwendungen, die Sie analog überwachen können.
Mit Rimscout ergänzen Sie Ihr klassisches Netzwerk Monitoring mit der Sicht auf die einzelnen Clients und machen so die Performance- oder Verbindungsprobleme direkt bei Ihren Anwendern sichtbar. Nachdem Sie den Rimscout-Client auf dem gewünschten Endgerät gestartet haben, registriert er sich automatisch am Portal Ihres Tenant. Im Hintergrund lädt der Client die hinterlegten Prüfungen herunter und startet sofort die ausgewählten Messungen. Die Ergebnisse landen aufbereitet in Ihren Tenants, so dass Sie als Administrator über das Rimscout-Portal den jeweiligen Status Ihrer Clients oder auch zusammengefasst Ihrer Standorte auswerten können.
Ausgewählte Alarme können Sie über eine REST-API sehr einfach zusätzlich in Ihr vorhandenes Netzwerk Monitoring integrieren, um frühzeitig über Performance-Änderungen informiert zu werden. So profitieren Sie zusätzlich zu dem Monitoring Ihrer Server, Switche und Router auch von der Überwachung der einzelnen Clients.