Teilprojekt D1
From GRK-Wiki
zum übergeordneten Forschungsbereich
Contents |
Workflow-basiertes Systemmanagement
Die primären Probleme des Managements großer, heterogener Systeme wie IT-gestützter Katastrophenmanagementsysteme sind durch Komplexität, Zuverlässigkeit und Kosten der Managementaktivitäten bestimmt. Für die Modellierung und Steuerung solcher Aktivitätsfolgen innerhalb der P2P-Middleware bieten sich insbesondere adaptive Workflows an. Einsatzbeispiele von Workflows in der Middleware-Ebene sind adaptive Koordinierungen von Aktivitäten wie das Konfigurieren und Ausführen von Diensten im Katastrophenfall oder allgemeines Systemmanagement. Im Kontext der selbstorganisierenden Netze erlauben die Workflows eine Aggregation der dynamischen, primitiven Dienste in komplexere Aktivitätsfolgen. Im Schwerpunkt dieses Dissertationsthemas wird eine Reduzierung der Komplexität der Vorgänge auf der P2P-Middleware-Ebene durch den Einsatz adaptiver Workflows angestrebt. Die Adaptivität schließt dabei sowohl die Generierung kompletter Workflows ein, als auch die Anpassung vordefinierter Workflows an veränderte Anforderungen. Eine weitere Stufe der Adaptation kann durch den Einsatz von Vorhersagetechniken erreicht werden. Die Integration des Themas in den Antrag wird über folgende übergreifende Fragestellungen erreicht:
- Untersuchung der Architekturen für die verteilte Ausführung von Workflows, die den Schwachpunkt einer zentralen Ausführungs-Engine eliminiert,
- Steigerung der Zuverlässigkeit und Effizienz sowohl der Engine-Architektur als auch der Abläufe durch Modellierung und Simulation der Workflows in Verbindung mit dem Thema D2.
Stand des Wissens
Die Automatisierung des Managements von Computersystemen im laufenden Betrieb ist in den letzten Jahren zu einem neuen Forschungsschwerpunkt innerhalb der Informatik avanciert (z. B. durch die Autonomic Computing Initiative von IBM). Die Gründe dafür liegen in der wachsenden Komplexität und Anzahl der Komponenten von Systemen, die ein manuelles Eingreifen zum Flaschenhals des Managements machen, sowie im zunehmenden Anteil der Managementkosten an den Gesamtkosten (total cost of ownership). Workflows eignen sich besonders gut für die Konfiguration von heterogenen, verteilten Systemen. Die derzeitigen Forschungsarbeiten sind recht beschränkt in Hinblick auf die Adaptivität [1] und betreffen in diesem Zusammenhang überwiegend das Management in Grid-Umgebungen. Der Bereich der Verteilung von Workflow-Ausführung ist ebenfalls wenig erforscht. Zwar ermöglichen existierende Lösungen [1] eine Teilnahme von mehreren verteilten Services am Workflow, jedoch ist die Ausführung zentral koordiniert und gesteuert. Ein Ansatz ist das dynamische Mapping der Ausführungsschritte auf unabhängige Akteure [2] wie Peers eines P2P-Systems, bei dem der Fortschritt der Ausführung durch direkte Kommunikation zwischen den Akteuren erreicht wird und somit eine zentralisierte Steuerung überflüssig macht.
Vorarbeiten der beteiligten Wissenschaftler
Die Arbeitsgruppe von A. Reinefeld beschäftigt sich seit Jahren mit Management von Grid-Umgebungen [3], [4]. Weiterhing wurden in der Gruppe Methoden zur automatischen Generierung von Workflows für die adaptive Systemverwaltung (Software-Installation, Datentransfer, Änderung von Konfigurationsparametern) entwickelt. Mittels deklarativer Spezifikation können diese Aktionen unter Verwendung des Systemzustands automatisch zu einem Workflow zusammengesetzt werden, um einen vorgegebenen Zielzustand des Systems zu erreichen. Nach der Ausführung des Workflows wird der Erfolg der Zwischenschritte ermittelt, um eine Beschreibung des neuen Systemzustands zu erzeugen und selbständig zu entscheiden, ob das Ziel erreicht wurde, oder ob eine erneute Iteration notwendig ist. Dieser Ansatz wurde in einem prototypischen System umgesetzt [5], das für das Management komplexer Ressourcen (z.B. Serverfarms) eingesetzt wird. Im Bereich der Modellierung und Vorhersage des Ressourcenbedarfs von Anwendungen wurde ein Verfahren entwickelt, das mittels mathematischer Methoden statistisch signifikante, wiederkehrende Muster in einem Signal (z.B. CPU-Last) herausfindet und Modelle des zukünftigen Signalverlaufes sowie Vorhersagen erstellt [6]. Weitere Arbeiten in der Gruppe von A. Reinefeld betreffen Ansätze zur Adaptivität auf der Grundlage von Peer-To-Peer-Techniken [7], [8]. Forschungen der Arbeitsgruppe von W. Reisig zur Bedienbarkeit und Rücksetzbarkeit von Workflows [9] und der von J. Fischer zu simulativen Laufzeitsystemen von Workflow-Engines [10] komplettieren die Vorarbeiten zu diesem Vorhaben.
Geplante Arbeiten
Die Dissertation soll sich in zwei Teile gliedern. Im ersten Teil sollen überwiegend Methoden und Algorithmen zur Generierung und zur Adaptation der Workflows untersucht werden, die Mechanismen der verteilten Ausführung (in Kooperation mit dem Forschungsbereich A des Antrags) bereitstellen und dabei Aspekte der Modellierung von Workflows im Hinblick auf Adaptivität und Verteilung berücksichtigen. Dabei sollen unter anderem existierende metamodellbasierte Workflow-Sprachen mit Elementen zur Adaptivität und der automatischen Generierung von Workflows erweitert werden und automatische Planer für die effiziente, automatische Generierung von Workflows für die Middleware-Ebene entwickelt werden. Der zweite Teil betrifft den Einsatz der erarbeiteten Techniken für das Management von Vorgängen auf der Middleware-Ebene eines Katastrophenmanagementsystems unter Einsatz der Vorhersagetechniken. Es sollen konkrete Architekturen für die Verteilung von Workflow-Engines für ihren Einsatz im Kontext von Anwendungsszenarien entwickelt werden und Workflows für die dynamische Migration und Replikation von Daten und Diensten bei Ausfällen, Überlastung und Angriffen untersucht werden. Dabei sind Vorhersagemodelle für die proaktive Bereitstellung von Ressourcen im Katastrophenfall oder Überlastung zu berücksichtigen. Die Simulation der erarbeiteten Konzepte und Architekturen (in Kooperation mit Thema D2) soll die Praxistauglichkeit und Zuverlässigkeit der Ansätze verifizieren.
Referenzen
[1] E. Deelman, J. Blythe, Y. Gil, C. Kesselman, G. Mehta, K. Vahi, K. Blackburn, A. Lazzarini, A. Arbree, R. Cavanaugh, and S. Koranda: Mapping abstract complex workflows onto grid environments. Journal of Grid Computing, 1(1), pp. 25–39, 2003.
[2] I. Taylor, M. Shields, I. Wang, O Rana: Triana Applications within Grid Computing and Peer to Peer Environments. Journal of Grid Computing, 1(2), pp. 199-217, 2003.
[3] A. Reinefeld, F. Schintke, T. Schütt: Scalable and Self-Optimizing Data Grids. In: Y. C. Kwong (ed.), Annual Review of Scalable Computing, vol. 6, Singapore University Press, Chapter 2, pp. 30 - 60, 2004.
[4] A. Reinefeld, F. Schintke: Grid Services - Web Services zur Nutzung verteilter Ressourcen. Informatik Spektrum. Springer-Verlag, pp. 129 – 135, April 2004.
[5] A. Andrzejak, U. Hermann, A. Sahai: Feedback Flow - An Adaptive Workflow Generator for System Management, accepted to ICAC 2005.
[6] A. Andrzejak, M. Ceyran: Characterizing and Predicting Resource Demand by Periodicity Mining. In: Journal of Network and System Management, special issue on Self-Managing Systems and Networks, Vol. 13, No. 1, Mar 2005.
[7] A. Reinefeld, F. Schintke: Concepts and Technologies for a Worldwide Grid Infrastructure. Euro-Par 2002 Parallel Processing, Springer LNCS 2400, pp 62-71, 2002.
[8] F. Schintke, T. Schütt, A. Reinefeld: A Framework for Self-Optimizing Grids Using P2P Components. International. Workshop on Autonomic Computing Systems, 14th Workshop on Database and Expert Systems Applications (DEXA'03), pp. 689 – 693, September 2003.
[9] A. Alexander, W. Reisig: Compositional Temporal Logic Based on Partial Order. In: Proc. of the 11th Int. Symp. on Temporal Representation and Reasoning TIME 2004, pp. 125-132, IEEE 2004.
[10] R. Sauer: Dynamische, Standard-basierte Workflow-Simulation mit ODEMx. Diplomarbeit. Humboldt-Universität zu Berlin, März 2005.
