Teilprojekt E4

Aus GRK-Wiki

Wechseln zu: Navigation, Suche

zum übergeordneten Forschungsbereich

Inhaltsverzeichnis

Integration von Geo-Informationssystemen

Die Informationsversorgung im Katastrophenfall muss sich auf eine Vielzahl von einzelnen Diensten stützen, die unterschiedliche Aspekte der Situation abdecken können. So sind eine Fülle von Informationen bereitzustellen wie beispielsweise topographische Karten des Gebietes, aktuelle Satellitenaufnahmen, Sensordaten aus dem Gebiet (Wetter, seismologische Daten), Kataster- und Zensusinformationen über die Bevölkerungsverteilung, Nachrichten über Ereignisse, Straßenverhältnisse, Zustände in Krankenhäusern, etc. Zur Unterstützung einer effizienten Handlungsplanung ist es unerlässlich, dass diese einzelnen Informationsquellen verdichtet und integriert werden. Dies muss, um stets aktuellste Daten zur Verfügung zu haben, erst zum Zeitpunkt der Formulierung einer Anfrage erfolgen. Zu beachten ist ferner, dass gerade in einem Katastrophenfall einzelne Informationsquellen ausfallen können oder unzuverlässig werden, sowie dass sich viele der Quellen ständig ändern bzw. inhärent ereignisorientiert sind. Eine wichtige Eigenschaft der zu integrierenden Daten, die diese auch von den Daten in vielen anderen Anwendungsbereichen unterscheidet, ist der inhärente Raum- und Zeitbezug. Informationen müssen vor allem dadurch in Zusammenhang gebracht werden, dass sie sich auf eine bestimmte Zeit und einen bestimmten Ort beziehen. Dieser Bezug muss in der Integrationsmethode verankert werden, um eine effiziente Informationswahl zu ermöglichen und Daten in kohärenter Weise integrieren zu können. Darüber hinaus hängt die Qualität und damit Nutzbarkeit der integrierten Daten von der Qualität der Ausgangsdaten sowie der Güte der verwendeten bzw. zur Verfügung stehenden Integrationsmethode ab und muss ebenfalls explizit modelliert, überwacht und dem Benutzer als Grundlage seiner Entscheidungen zur Verfügung gestellt werden.

Stand des Wissens

Die Integration statischer Informationssysteme wird seit vielen Jahren untersucht. Ansätze umfassen föderierte Datenbanken, Data Warehouses und Mediator-basierte Informationssysteme [1], [2]. Während vielfältige Vorschläge zur Überbrückung der technischen Heterogenität existieren – zum Beispiel Einsatz von Web Services oder objektorientierter Middleware wie CORBA – gibt es noch keine ausreichende Lösung zur Überwindung der Hauptschwierigkeit bei der Integration, der Überbrückung der semantischen und schematischen Heterogenität der unterschiedlichen Quelldaten [3]. Dies trifft auch im GIS Umfeld zu [4], da semantische Probleme von den Spezifikationen des OpenGIS-Konsortiums nicht adressiert werden (http://www.opengis.org). Zur Überbrückung semantischer Heterogenitäten gibt es zwei Ansätze – entweder die direkte Angabe von Korrespondenzen zwischen Schemaelementen [5] oder die Verwendung von Abbildungen der Schemaelemente in eine zentrale Ontologie [6]. In beiden Fällen sind Abbildungen zwischen formalen Konzepten notwendig. Die Modellierung von Raum-, Qualitäts- und Zeitbezügen der Korrespondenzen in einer symbolischen Modellsprache wie denen, die Ontologien zugrunde liegen, scheidet aber wegen der zu erwartenden Ineffizienz aus [7]. Ansätze, Korrespondenzen mit domänenspezifischen, hier also GIS-spezifischen, Annotationen zu versehen und diese auch für die Anfrageplanung auszunutzen, existieren noch kaum.

Vorarbeiten der beteiligten Wissenschaftler

U. Leser arbeitet seit vielen Jahren im Bereich der Daten- und Informationsintegration. Dies umfasst Arbeiten zur Modellierung und Nutzung semantischer Korrespondenzen zwischen heterogenen Informationsquellen [8] zu Architekturen von Integrationssystemen [9], zu Algorithmen zur qualitätssensitiven Anfrageplanung in verteilten Informationssystemen [10] und Einsatz von objektorientierter Middleware zur Informationsintegration [11]. In [10], [12] hat er ein Qualitätsmodell mitentwickelt, das eine dynamische Quellauswahl durch multifaktorielle Optimierung verschiedener Qualitätsindikatoren wie Erreichbarkeit, Vollständigkeit oder Verlässlichkeit ermöglicht. Hauptanwendungsgebiet seiner Forschung sind Informationssysteme im naturwissenschaftlichen Bereich [13], [14]. Die Arbeiten von D. Dransch befassen sich mit der Verarbeitung von Geo-Daten mittels Geo-Informationssystemen und -Services (GIS). Wesentliche Forschungsaspekte dabei sind die handlungsorientierte Gestaltung von GIS [15] und die Visualisierung von Geo-Daten für die Exploration wie auch für die Kommunikation von Information [16]. Ein untersuchtes Anwendungsfeld ist das Katastrophenmanagement [17].

Geplante Arbeiten

Das Vorhaben untersucht die Anwendung von Methoden der datenbankbasierten Informationsintegration auf ihre Anwendbarkeit auf die Integration von raum- und zeitbezogenen Geo-Daten in Szenarien wie dem Katastrophenmanagement. Hierzu werden, aufbauend auf Vorarbeiten der Antragsteller, Sprachen und Modelle zur Spezifikation von semantischen Beziehungen zwischen verschiedenen Informationsquellen um die drei Dimensionen Zeitbezug, Raumbezug und Qualität der Datenquellen erweitert. Dadurch kann ein Algorithmus beispielsweise ermitteln, ob für eine, nur eine bestimmte Region A betreffende Anfrage, eine Datenquelle, die nur Informationen über eine Region B enthält, überhaupt benutzt werden sollte. Die Dimensionen müssen unmittelbar in den Anfrageplanungsprozess verankert werden, um

  • räumlich und zeitlich konsistente Daten zu erhalten,
  • Aussagen über die Qualität der integrierten Daten treffen zu können, und
  • die gewünschten Daten in ausreichender Geschwindigkeit bestimmen zu können.

Aufbauend auf den Modellen für GIS-annotierte Schema- und Datenkorrespondenzen werden Anfrageübersetzungsalgorithmen entworfen, die zentrale Anfragen an eine autonome und verteilte Menge von Geo-Informationssystemen durch Zerlegung der Anfrage, Übersetzung der Teilanfragen und Zusammensetzung des Ergebnisses aus den Teilergebnissen ermöglichen. Wichtig ist dabei die Einbindung notwendiger Datentransformationen, um beispielsweise eine einheitliche Behandlung von Daten in unterschiedlichen Skalen oder Koordinatensystemen zu ermöglichen. Die zu verwendenden Transformationen sollten aus den Annotationen der Korrespondenz automatisch ableitbar sein.

Referenzen

[1] S. Busse, R. Kutsche, U. Leser, H. Weber: Federated Information Systems- Concepts, Terminology and Architectures, Technische Universität Berlin, 1999.

[2] S. Conrad: Föderierte Datenbanksysteme- Konzepte der Datenintegration. Berlin, Heidelberg, New York, Springer Verlag, 1997.

[3] R. Miller, L. Haas, M. Hernandez: Schema Mapping as Query Discovery. In: Proc. of 26th Conference on Very Large Database Systems, Cairo, Egypt, ACM Press, New York, 2000.

[4] L. Bernard, M. Einspanier, M. Lutz, C. Portele: Interoperability in GI Service Chains - The Way Forward. In: Proc. of 6th Conf. on Geographic Information Science (AGILE 2003), Lyon, France, 2003.

[5] E. Rahm, P. Bernstein: A survey of approaches to automatic schema matching. The VLDB Journal 10(4), pp. 334-350, 2001.

[6] V. Kashyap, A. Sheth: Semantic Heterogeneity in Global Information Systems- The Role of Metadata, Context and Ontologies. In: Book "Semantic Heterogeneity in Global Information Systems: The Role of Metadata, Context and Ontologies". M.P. Papazoglou, G. Schlageter (eds.) San Diego, Academic Press, pp. 139-178, 1998.

[7] I. Horrocks: DAML+OIL, A Description Logic for the Semantic Web. In: IEEE Data Engineering Bulletin 25(1), pp. 4-9, 2002.

[8] U. Leser: Query Planning in Mediator Based Information Systems. Dissertation, Technical University Berlin, 2000.

[9] S. Busse, R. Kutsche, U. Leser, H. Weber: Federated Information Systems- Concepts, Terminology and Architectures. Technische Universität Berlin, 1999.

[10] F. Naumann, U. Leser, J. Ch. Freytag: Quality-driven Integration of Heterogeneous Information Systems. In: Proc. of 25th Conference on Very Large Database Systems, Edinburgh, UK, pp. 447 - 458, 1999.

[11] K. Jungfer, U. Leser, P. Rodriguez-Tome: Constructing IDL Views on Relational Databases. 11th Conference on Advanced Information Systems Engineering; LNCS 1626, Heidelberg, Germany, Springer, pp. 255 - 269, 1999.

[12] F. Naumann, J.- C. Freytag, U. Leser: Completeness of Integrated Information Sources. In: Information Systems 29(7), pp. 583 - 615, 2004.

[13] U. Leser, F. Naumann: (Almost) Hands-Off Information Integration for the Life Sciences. In: Innovative Database Research (CIDR 2005), Asimolar, pp. 131 - 143, 2005.

[14] S. Trissl, K. Rother, H. Müller, I. Koch, T. Steinke, R. Preissner, C. Frömmel, U. Leser: Columba- An Integrated Database of Proteins, Structures, and Annotations. In: BMC Bioinformatics to appear, 2005.

[15] D. Dransch: Handlungsorientierte Mensch-Computer-Interaktion für die kartographische Informationsverarbeitung mit Geo-Informationssystemen. Habilitationsschrift. In: Berliner Geowissenschaftl. Abhandlungen, Reihe C, Bd. 18, 2002.

[16] D. Dransch, M. Sester (eds.): Visualisierung und Erschließung von Geodaten. Tagungsband zu „GEOVIS 2003“, Kartographische Schriften Bd. 7. Kirschbaum Verlag, Bonn, 194 Seiten, 2003.

[17] D. Dransch: Internetbasierte Geoinformationsservices für das Katastrophenmanagement. In: Tagungsbeiträge zu „Webmapping 2003“, 2003.

Persönliche Werkzeuge
Sprache