
Das IT-Magazin der ORDIX AG mit Fachbeiträgen zu Datenbanken, Unix und Java/XML.
Sie sind in Ihrem Unternehmen verantwortlich für die Verfügbarkeit der IT-Dienste? Diese Verantwortung kann sowohl gegenüber externen Firmen als auch gegenüber internen Abteilungen bestehen. Und Sie werden an der Qualität der Dienste gemessen. Mit dem Wort "messen" wird es nun schwierig und wir sind mitten im Thema "Service Level Management".
Aber keine Angst vor langen Abhandlungen. PATROL Express fährt hier einen recht pragmatischen Ansatz. Wie wäre es, wenn Sie Ihrem Kunden oder Ihren Kollegen in der Vertriebsabteilung zum Thema Überwachen und Verfügbarkeit einfach sagen könnten "Bedien‘ dich selbst!"?
Damit wollen wir natürlich nicht unhöflich sein. Wir wollen lediglich auf die Möglichkeit hinweisen, dass der technisch einigermaßen kompetente Kollege aus der Fachabteilung ganz alleine, ohne Ihre Unterstützung festlegen kann, was auf seinem Server überwacht werden soll. Ebenso, wie die Verfügbarkeit dieses Rechners definiert sein soll.
Bei Problemen wird er dann automatisch (gemeinsam mit Ihnen) per E-Mail benachrichtigt. Und die Überwachungs- und Service-Daten kann er sich jederzeit auf einem Web-Server anschauen.
Wer diese Selbstbedienung für ein Horror-Szenario hält, muss nicht gleich entsetzt die Hände über dem Kopf zusammenschlagen. PATROL Express bietet ein mehrstufiges Benutzerkonzept an. Es erstreckt sich vom technisch kompetenten bis zum technisch wenig versierten Kunden oder Kollegen. Letzterer hat dann lediglich lesenden Zugriff: Was und wie gemessen wird, entscheiden dann wieder Sie. Beruhigt? Gut, dann schauen wir uns das mal genauer an.
PATROL Express überwacht in erster Linie remote - anders als das bisherige Konzept der PATROL Agenten. Es gibt also keine dezentralen, lokalen Agenten. Überwacht wird die klassische IT-Infrastruktur mit Servern, Netzwerkgeräten und Anwendungen. Die dabei ermittelten Daten werden automatisch in eine Service-Auswertung übernommen.
Die gesamte Datenhaltung (Monitoring-, Service- und Konfigurationsdaten) erfolgt zentral. Die Bedienung und die Konfiguration geschieht über weite Strecken ausschließlich per Web-Browser.
Im Wesentlichen besteht PATROL Express nur aus zwei Software-Komponenten. Dies ist zum einen das zentrale Service Integration Portal (SIP) und zum anderen der Remote Service Monitor (RSM).
Beim RSM handelt es sich wirklich nur um ein Programm. Beim SIP muss man fairerweise sagen, dass sich hinter der eigentlichen Software von BMC noch eine Oracle Datenbank und ein Web-Server verbergen. Beide stellen in Summe mit mindestens 1 GB Memory und 30 GB Plattenplatz nicht gerade geringe Anforderungen an die Hardware.
Der RSM ist die aktive Überwachungseinheit von PATROL Express. Er bekommt vom SIP bzw. dessen Benutzern die Information, welche Objekte er überwachen soll. Da er dies ausschließlich remote macht, kann er dies "nur" mit Hilfe von diversen Netzwerkprotokollen.
Angefangen von einer einfachen Ping-Überprüfung über SNMP, ssh, PerfMon und WMI unterstützt er auch z. B. Oracle und Sybase SQL. Die Anzahl der eingesetzten RSMs hängt in erster Linie von der Anzahl der zu überwachenden Objekte und der Netzwerk-Infrastruktur ab.
Falls der Administrator es einem Benutzer erlaubt, kann sich dieser seinen eigenen RSM herunterladen und selbstständig auf seinem System installieren. Der Installations- und Konfigurationsvorgang, der damit verbunden ist, ist wirklich sehr einfach.
| |
| Abb. 1: Architektur - Unternehmensansicht. |
Vereinfacht gesagt, hat das SIP drei Aufgaben:
Alle RSMs schicken ihre Daten via HTTP(S) an das SIP. Dort werden sie für die entsprechenden grafischen Darstellungen verdichtet und bezüglich ihrer Auswirkungen auf bestimmte Services ausgewertet. Der Benutzer kann sich seine Daten per Web-Browser in verschiedenen Varianten und Verdichtungsstufen (täglich, wöchentlich, monatlich) anschauen.
Für das obige Szenario der "Selbstbedienung" ist das SIP der "Selbstbedienungsladen": Der SIP- Administrator oder aber der technisch kompetente Benutzer – vielleicht mit ein wenig Unterstützung – kann aus einem umfangreichen Paket auswählen, was er auf welchen Servern wie oft überwacht haben will.
Daneben kann er regelmäßige oder unregelmäßige Wartungszeiträume festlegen. Das sind die Zeiten, in denen das System nicht übrwacht wird; und er kann die Service Measure Goals festlegen. Darunter fällt zum einen die Verfügbarkeit als prozentualer Anteil der Zeit ohne Alarm. Zum anderen ist dies die Mean Time To Repair, die durchschnittliche Zeit für eine Fehlerbehebung. Diese beiden Einstellungen erlauben in den Grafiken einen Soll-Ist-Vergleich.
Wer betreibt nun den Selbstbedienungsladen? Die beiden Grafiken zur Architektur vermitteln einen ersten Eindruck: Entweder ist dies die IT-Abteilung, die damit die Überwachung der internen Server realisiert oder es ist der Service Provider, der seinen Kunden diese Überwachung zur Verfügung stellt.
| |
| Abb 2: Architektur - Service Provider Ansicht. |
Als dritte Variante gibt es noch die Möglichkeit, PATROL Express als Dienst zu mieten. Dieser Dienst steht unter dem schönen Namen Guardian Angel zur Verfügung und wird je nach eingesetzten Überwachungskomponenten jährlich abgerechnet.
PATROL Express kann vorhandene PATROL Classic Agenten einbinden und die dort ermittelten Daten in das eigene Verfahren übernehmen.
Daraus resultieren zwei Dinge: Erstens ist PATROL Express an den Stellen, wo die Standardüberwachung nicht ausreicht, durch PATROL Classic zu erweitern. Zweitens kann PATROL Express auch in Unternehmen eingesetzt werden, die heute schon PATROL Classic im Einsatz haben. PATROL Express kann dort an den Stellen eingesetzt werden, wo PATROL Classic z. B. aus finanziellen oder organisatorischen Gründen nicht in Frage kam.
PATROL Express lässt sich durch die deutlich mächtigere Überwachung lokaler PATROL Agenten und ihrer Knowledge Module erweitern.
Auf Basis von SNMP und PerfMon ist die Standardüberwachung ebenfalls erweiterbar. Allerdings ist hier dann auch das Ende erreicht: Auf das Einhängen eigener Skripte muss entweder verzichtet werden oder man wählt den Weg über einen zusätzlichen PATROL Agenten. Dieser ist jedoch mit Zusatzkosten verbunden. SNMP- und PerfMon-Experten können allerdings über diese Schnittstellen auch solche Daten zur Verfügung stellen, die per Skript ermittelt werden.
Der Verwaltungsaufwand für PATROL Express hält sich angenehm in Grenzen im Vergleich zu der sehr mächtigen und flexiblen, aber teilweise sehr pflegeintensiven PATROL Classic Architektur mit den PATROL Agenten.
Beeindruckend ist die kurze Zeit, in der sogar ein Neuling im Bereich Monitoring zu ansehnlichen Ergebnissen kommen kann. Außer dem RSM muss insbesondere für das Monitoring keine Software installiert werden. Damit bleiben dem Betreuer zeitraubende Update-Aktionen erspart.
Ist ein RSM erst einmal installiert, werden alle weiteren Upgrades automatisch durchgeführt. Bezüglich der Voraussetzungen auf den zu überwachenden Systemen empfiehlt sich allerdings der genaue Blick in das Handbuch: Dass man für eine Überwachung per Secure Shell die ssh-software installiert haben muss, ist naheliegend. Kniffliger sind da schon z. B. manche Registry-Einträge für Windows Server.
Objektiv schwer zu beurteilen ist die wirkliche Aussagekraft der Daten und der Überwachung. Die Entwickler von PATROL Express müssen oft über den schmalen Grad zwischen Flexibilität und möglichst einfacher Bedienung gehen. Ein Beispiel soll dies verdeutlichen:
Bei der Überwachung der CPU-Auslastung einer Maschine kann man angeben, dass z. B. bei 95 % ein Alarm erfolgen soll. Wenn nun gerade zu dem Messzeitpunkt dieser Schwellwert überschritten ist, ein paar Sekunden oder Minuten später aber wieder eine deutlich niedrigere Auslastung vorliegt, so wird man sicherlich oft sagen, dass in dieser Situation keine Alarmierung sinnvoll oder gar notwendig ist.
Dem PATROL Classic Agenten kann man klar machen, dass ein kritischer Zustand erst vorliegt, wenn diese hohe CPU-Auslastung mehrfach gemessen worden ist. PATROL Express fehlt diese Möglichkeit (noch).
Bei den Service-Auswertungen verkraftet man diesen Umstand sicherlich, wenn es nicht gerade auf die dritte oder vierte Nachkommastelle bei der Verfügbarkeitsstatistik ankommt. Schwieriger sind da schon die in diesem Sinne unnötigen Alarme, die – falls so konfiguriert – auch eine entsprechende Benachrichtigung per E-Mail auslösen.
Stichwort "Service": PATROL Express geht sehr vorsichtig mit dem Ausdruck "Service Level Management" um. Wohl wissend, dass dies ein sehr komplexes Thema ist. Im eigentlichen Programm ist dann auch nur noch von "Service" und "Service Measure" die Rede.
Mit PATROL Express ist es nicht möglich, komplexere Servicevereinbarungen abzubilden. Das bleibt anderen PATROL Tools vorbehalten. Allerdings muss man auch erwähnen, dass manche Service Level Management Projekte an ihrer eigenen Komplexität gescheitert sind, so dass dieser einfache Ansatz durchaus praxisnah ist.
PATROL Express stellt auf jeden Fall eine interessante Alternative zu den klassischen, agentenbasierten Monitoring Tools dar. Die einfache Einrichtung mit einem flexiblen Benutzerkonzept zählt ebenso zu den Stärken wie das Web-Portal. Dessen Serviceaufsatz hat einen gewissen Charme, der in der Einfachheit begründet liegt. Dass man mit diesem Tool nicht alles kann, liegt auf der Hand. Aber vielleicht reicht für’s Erste auch eine 80 %-Lösung.
Wenn Sie sich also einmal selbst bedienen wollen, schreiben Sie an info@ordix.de: Der Guardian Angel Dienst ist kostenlos zu testen. Er vermittelt auch ein gutes Gefühl für den Umgang mit PATROL Express. Natürlich bieten wir Ihnen zusätzlich gerne eine Schulung zu PATROL Express an.
Axel Röber (info@ordix.de).