Teilprojekt C2

Aus GRK-Wiki

Wechseln zu: Navigation, Suche

zum übergeordneten Forschungsbereich

Inhaltsverzeichnis

Infrastruktur zur Verarbeitung von Metadaten bei der Ausführung von Anfragediensten

In den vergangenen Jahren ist immer deutlicher geworden, dass neben den Daten auch die diesen Daten zugeordneten beschreibenden Daten (Metadaten) eine größere Bedeutung zukommt. Dabei geht Beschreibung von Metadaten heute häufig über reine Strukturbeschreibungen hinaus; sie schließt insbesondere die Berücksichtigung „genereller Eigenschaften“ der Daten, wie allgemeine Qualitätsmerkmale [1], ihre jeweilige Herkunft (Data Lineage) [2] und diverse Annotationen ein. Häufig sind in verschiedenen Anwendungsbereichen diese Metadaten mindestens ebenso wichtig und aussagerelevant wie die Daten selbst. Im Bereich der Datenbanksysteme spielen Metadaten eine dominante Rolle bei der Anfragebearbeitung und Anfrageoptimierung; ohne diese wäre die Planung einer effizienten Ausführung nicht möglich. Der sich schnell entwickelnde Bereich des Semantic Web baut im Wesentlichen auf der Beschreibung, Sammlung und Nutzung von Metadaten zur maschinellen Verarbeitung unter Berücksichtigung der Bedeutung (Semantik) von Daten auf. Um den Anforderungen für die Ausführung von Anfragen und Diensten in hochflexiblen Netzen – insbesondere im Bereich der Anwendung – gerecht werden zu können, kommt der sicheren Verwaltung und Nutzung von anwendungsbezogenen Metadaten besondere Bedeutung zu. Gegenstand der Forschung wird in diesem Vorhaben die Untersuchung sein, welche Metadaten in der existierenden Netzwerkumgebung und der geplanten Anwendung sinnvoll und notwendig sind, um die geforderten Datenzugriffe und die Ausführung von Diensten mit möglichst hoher Zuverlässigkeit sicherzustellen.

Stand des Wissens

Die Verwaltung und Nutzung von Metadaten ist zur Beschreibung von Strukturen und Daten seit der Entwicklung relationaler Datenbankmanagementsysteme (DBMSen) Gegenstand der Forschung. Die Nutzung in Form von Schemata und Histogrammen (Werteverteilungen zur Bestimmung von Selektivitäten) ist in diesem Kontext aber eher von DBMS-interner Bedeutung gewesen, um optimale Anfrageausführungspläne (QEPs) für deklarative Anfragen zu erzeugen. In den letzten Jahren hat jedoch die Nutzung von Metadaten in vielen Bereichen an Bedeutung gewonnen, insbesondere für viele Anwendungen, so zum Beispiel im Bereich der Bioinformatik/Genomforschung, in der Daten durch „Zusatzdaten“ annotiert werden. Aber auch im Bereich des Data Warehousing spielt die Herkunft von Daten (Data Lineage) eine besondere Bedeutung [1].

Vorarbeiten der beteiligten Wissenschaftler

J.- C. Freytag widmet sich seit vielen Jahren Problemen der Anfragebearbeitung und Anfrageoptimierung [2] und setzt sich dabei auch intensiv mit der datenbankinternen Nutzung von Metadaten auseinander [3], [4]. Die Nutzung qualitätsorientierter Metadaten für die Anfragebearbeitung waren ebenfalls wesentlicher Bestandteil seiner Forschung [5], [6], [7], ebenso die Nutzung ontologiebasierter semantischer Daten für die Anfrageumschreibung [8], [9]. J.-P. Redlich befasst sich aktuell, im Rahmen des Berlin Roof Net-Projektes, mit der dezentralen Speicherung von Daten für Netzbasisdienste, wie z.B. DNS, in selbstorganisierenden Netzen. Grundlage für das Speichern und Abrufen der Daten sind verteilte Hash-Tabellen (DHT), jedoch angepasst an die Bedürfnisse drahtloser Multihop-Netze, bei denen, durch geeignete Caching-Stategien, die Anzahl der von einer Anfrage zu durchlaufenden Hops zu minimieren ist.

Geplante Arbeiten

In diesem Dissertationsvorhaben soll die Nutzung von Metadaten zur verbesserten Planung von Datenanfragen und Diensten für das Katastrophenmanagement untersucht werden. Dazu ist es zunächst notwendig zu bestimmen, welche Metadaten zu modellieren, zu erfassen und zu verwalten sind. Des Weiteren sollen Algorithmen und Datenstrukturen entwickelt werden, die die vorhandenen Metadaten für die (effektive) Planung und Adaption des Datenzugriffs und der Ausführung von Diensten nutzen. Ebenso wichtig erscheint auch die Entwicklung geeigneter Update-Strategien, die Veränderungen im Netz möglichst zeitnah und effizient propagieren.

Referenzen

[1] Y. Cui, J. Widom, J. Wiener: Tracing the lineage of view data in a warehousing environment. ACM Transaction Database Systems 25(2), pp. 179-227, 2000.

[2] J.- C. Freytag, D. Maier, G. Vossen: Query Processing for Advanced Database Systems. In: Selected Contributions from a Workshop on Query Processing in Object-Oriented, Complex-Object and Nested Relation Databases, Internationales Begegnungs- und Forschungszentrum für Informatik, Schloss Dagstuhl, Germany, June 1991 Morgan Kaufmann, 1994.

[3] J.- C. Freytag, N. Goodman: On the Translation of Relational Queries into Iterative Programs. ACM Transaction Database Systems 14(1), pp. 1-27, 1989.

[4] J.- C. Freytag: The Basic Principles of Query Optimization in Relational Database Management Systems. IFIP Congress 1989, pp. 801-807, 1987.

[5] F. Naumann, U. Leser, J.- C. Freytag: Quality-driven Integration of Heterogenous Information Systems. VLDB 1999, pp. 447-458, 1999.

[6] M. Stillger, J.- C. Freytag: Testing the Quality of a Query Optimizer. IEEE Data Eng. Bull. 18(3): pp. 41-48, 1995.

[7] F. Naumann, J.-C . Freytag, M. Spiliopoulou: Quality Driven Source Selection Using Data Envelope Analysis. IQ 1998, pp. 137-152, 1998.

[8] C. Ben Necib, J. Ch. Freytag: Ontology Based Query Processing in Database Management Systems. CoopIS/DOA/ODBASE 2003: 839-857, 2003.

[9] C. Ben Necib, J. Ch. Freytag: Using Ontologies for Database Query Reformulation. ADBIS (Local Proceedings), 2004.

Persönliche Werkzeuge
Sprache