
Das IT-Magazin der ORDIX AG mit Fachbeiträgen zu Datenbanken, Unix und Java/XML.
Das eigens für dieses Projekt neu entwickelte SAP-Modul bedient den Bankenkernbereich. Deshalb werden an diese Applikation hinsichtlich Verfügbarkeit und Performance besonders hohe Anforderungen gestellt. Um diesen Anforderungen zu genügen, wurde eine entsprechende Systemarchitektur gewählt und ein umfangreiches Monitoring implementiert.
Das zugrunde liegende SAP System besteht aus einer DB2-Datenbank, die auf MVS unter z/OS läuft, aus dem zentralen Applikationsserver unter USS und aus mehreren Applikationsservern unter AIX. Zentraler Applikationsserver bedeutet in diesem Zusammenhang, dass auf dem Applikationsserver unter USS der Message- und der Enqueue-Server laufen. Als interne Systemautomation wird "System Automation for OS/390" (SAfOS) eingesetzt. Abbildung 1 zeigt die Systemarchitektur noch mal in einer Übersicht.
|
|
| Abb. 1: Systemarchitektur der Anwendung, die mit SAP entwickelt wurde. |
Im Rahmen des Projektes wurden zuerst die zu überwachenden Parameter festgelegt, bevor man in die Diskussion über die zu verwendenden Werkzeuge eintrat. Hierzu mussten unter anderem folgende Fragen beantwortet werden:
Die daraus festgelegten Anforderungen wurden wie folgt umgesetzt:
Zu einem Teil werden die Möglichkeiten der einzelnen Systemkomponenten zur Überwachung genutzt, wie z. B. die Fehlermeldungen der DB2-Datenbank, des SAfOS und des Betriebssystems der AIX-Applikationsserver. Zum anderen werden für den Bereich z/OS, für die Überwachung der Applikationsserver und für das SAP System Überwachungswerkzeuge der Firma BMC zu Hilfe genommen. Für das z/OS ist dies Mainview, die Überwachung der Applikationsserver findet mit PATROL Classic statt und das SAP System wird mit der PATROL for SAP Solution Suite überwacht.
Um eine einheitliche Bearbeitung aller Störungen zu gewährleisten, sollte eine zentrale Konsole eingesetzt werden, welche in der Lage ist, die Events aller eingesetzten Monitoring-Komponenten zu verarbeiten. Für derartige Integrationsanforderungen hat das Unternehmen das Produkt „MasterCell“ im Einsatz. Alle Komponenten wurden über Schnittstellen an die zentrale Störmeldekonsole (ZSK) angeschlossen. Dort laufen die Warnungen und Alarme zusammen. Abbildung 2 zeigt einen Ausschnitt der MasterCell-Konsole.
Abb. 2: Blick auf die Events in der MasterCell-Konsole.
MasterCellDie Firma IT Masters, die diese MasterCell-Konsole entwickelte, wurde im Verlauf des Projektes Teil der Firma BMC. Die MasterCell-Konsole wird nun als Teil der PATROL Familie unter dem Namen "PATROL Impact Manager" angeboten. Das Projekt hat den Verantwortlichen gezeigt, wie gut sich diese beiden Komponenten ergänzen. |
Für jedes der definierten Ereignisse hat die verantwortliche Fachabteilung eine Maßnahme festgelegt, die es dem Leitstand ermöglicht, adäquat zu reagieren. Somit ist sichergestellt, dass keine unvorhergesehenen Situationen entstehen.
PATROL for SAP Solutions sorgt für das Monitoring des SAP Systems. Ziel ist eine Verkürzung der Reaktionszeiten im Fehlerfall und damit eine höchstmögliche Verfügbarkeit der Applikation. Das Gesamtsystem wird kontinuierlich unter Berücksichtigung betriebsbedingter Offline-Zeiten bestimmter Komponenten überwacht.
Die Vorgaben waren, die Überwachungsmeldungen unter den Gesichtspunkten der Verfügbarkeit, kritischer Systemereignisse und möglicher Fehlentwicklungen von Systemparametern darzustellen.
Kritische Systemereignisse und fehlerauslösende Tendenzen werden erkannt. Der gewünschte Zustand der kritischen Systemkomponente wird weitgehend durch automatische Aktionen wieder hergestellt. Kann oder soll eine solche Aktion nicht automatisiert ausgeführt werden, wird eine Meldung an die ZSK übermittelt. Mit Hilfe der von der Fachabteilung vorgegebenen Lösungswege beseitigt der Betrieb das aufgetretene Problem.
Die Überwachungskriterien werden vom R/3-Basisbetrieb kontinuierlich überprüft und bei Bedarf neu festgelegt und umgesetzt. Das bedeutet, Änderungen von Parametern oder Schwellwerten können aus dem SAP System heraus ohne notwendige Kenntnisse der anderen Komponenten der Alarmkette eingestellt werden.
BMC PATROL for SAP Solutions ist in ABAP entwickelt, die Datensammlung und deren Management finden in dem R/3 System statt. Die Datensammlung nutzt die gleichen Funktionen wie die SAP-eigene Überwachungskomponente CCMS, bietet darüber hinaus jedoch zusätzliche Parameter und systemübergreifende Überwachungsmöglichkeiten an.
Als Kollektor (/BMC/TR _DATA_COLLECTOR) gestartet, belegt PATROL for SAP Solutions permanent einen Hintergrundprozess. Treten Engpässe bei den Prozessen auf, ist die Überwachung auch in solchen Situationen stets gewährleistet.
Darüber hinaus gibt es einen stündlich gestarteten Job (/BMC/TR_PME_COLLECTORS_GUARD), der prüft, ob der Kollektor noch aktiv ist und notfalls versucht, ihn wieder zu starten.
Für die einzelnen Parameter wird eine Priorität festgelegt. Über diese Priorität werden bei Schwellwertüberschreitungen die daraus resultierenden Systemereignisse ausgelöst. Sie werden an die PATROL Agenten auf den Applikationsservern weitergeleitet. Die Agenten werden in Verbindung mit dem SAP Knowledge Module genutzt, um die Warnungen und Alarme an die ZSK weiterzugeben. Die PATROL Agenten laufen auf allen Applikationsservern und überwachen dort zusätzlich das Betriebssystem.
Im Gegensatz zu den üblichen Knowledge Modulen von PATROL, mit denen etwa das Betriebssystem Unix überwacht wird, werden mit dem SAP Knowledge Modul nicht alle Messwerte dargestellt und historisiert, sondern nur definierte Warn- oder Alarm-Stati aus dem R/3 System weitergegeben und in der ZSK dargestellt.
Neben der Möglichkeit, Alarme an die PATROL Agenten weiterzuleiten, bietet PATROL for SAP Solutions eine Management- und Visualisierungskonsole, die als Transaktion aufgerufen und innerhalb des SAP-GUI abgearbeitet wird.
Von dieser Konsole aus ist es möglich, alle vorhandenen SAP Instanzen über RFC-Verbindungen gleichzeitig zu überwachen und zu bedienen. In dieser Konsole werden Messintervalle, Schwellwerte für die zu überwachenden Parameter und automatische oder Alarm-Aktionen eingestellt (siehe Abbildung 3).
Abb. 3: Management- und Visualisierungskonsole mit Sicht auf diverse SAP Systeme.
Auf einen Blick können hier sämtliche SAP Systeme, die überwacht werden, auf mögliche Probleme hin überprüft werden. Unterhalb der Systeme wird direkt aufgeführt, wo das mögliche Problem aufgetaucht ist: ob in der Datenbank, ob im Betriebssystem oder ob ein bestimmter Applikationsserver Probleme hat. Von dieser Konsole aus kann dann ein Drilldown stattfinden, der den Störfall genau lokalisiert (siehe Abbildung 4).
Abb. 4: Problem Screen von PATROL for SAP Solutions.
Allen drei an der Überwachung beteiligten Betriebsgruppen wird der Zustand der SAP Anwendung nun in einer ihnen vertrauten Form dargestellt: Mit der Management- und Visualisierungskonsole steht den SAP Administratoren ein vollständig in SAP integriertes Werkzeug zur Verfügung. Für den Unix Betrieb stellt die klassische PATROL Konsole alle wesentlichen Informationen dar. Hier werden kritische Ereignisse historisiert und PATROL-typisch ins Service Reporting übernommen. Last but not least werden alle kritischen Ereignisse an die ZSK weitergereicht, um eine hohe Verfügbarkeit rund um die Uhr zu gewährleisten.
In einer der nächsten Ausgaben werden wir genauer auf den Einsatz der BMC-Software unter Betriebsbedingungen eingehen.
Uwe Rübesamen (info@ordix.de).