GraphScales Abstraction-Refinement Ansatz

Die Innovation des GraphScale Ansatzes besteht darin, dass für das Schlussfolgern und Abfragen eine komprimierte Zusammenfassung der Daten, eine sog. "Abstraktion", benutzt wird. Diese Abstraktion wird aus den Daten berechnet und während des Schlussfolgerungsprozesses fortgeschrieben. Sind alle Schlussfolgerungen für die Abstraktion berechnet, können diese, ähnlich einer Dekompression, zurück zu den originalen Daten geschrieben werden. Ergebnis ist ein vollständig materialisierter Datenbestand, der bei Abfragen auch alle abgeleiteten Fakten enthält. Dieses Verfahren ist beweisbar korrekt und vollständig und wissenschaftlich beschrieben. Für Abfrage z.B. über die SPARQL-Schnittstelle von GraphScale stellt die Abstraktion darüber hinaus einen optimierten Index dar, mit dem sich Anfragen effizient berechnen lassen.

GraphScale-Architektur

GraphScale ist eine Technologie, die ausdrucksstarkes Schlussfolgern und Triple bzw. Datenbanksystemen auf hochperformante Weise miteinander verbindet. Diese Verknüpfung ist konzeptionell und technisch nicht trivial, wenn realistische Anforderungen hinsichtlich Skalierbarkeit und Flexibilität eine Rolle spielen. GraphScale ist das erste System, dass Schlussfolgern mit der Ontologiesprache OWL 2 mit existierenden Datenspeichersystemen nach industriellen Maßstäben effektiv verknüpft. Die nebenstehende Abbildung zeigt die allgemeine Gesamtarchitektur einer GraphScale-Lösung. Dabei stützt sich die Implementierung auf bestehende Schnittstellenstandards, um bekannte Schlussfolgerungs- und Datenbanksysteme direkt ansprechen zu können. Über OWL-API und OWLlink lassen sich OWL 2 Schlussfolgerungssysteme wie Konclude oder andere für das Schlussfolgern mit der Abstraktion nutzen. Für das Daten-Back-End ist eine SPARQL oder SQL Schnittstelle ausreichend. Für SPARQL-Abfragen an das Gesamtsystem bestehen zwei Optionen. Zum einen kann der materialisierte Datenbestand über die Schnittstelle des Back-Ends abgefragt werden, oder aber via GraphScale über den speziellen Abstraktionsindex. Ein bestehende, semantische Anwendung ist aufgrund dieser Architektur leicht mit der GraphScale-Technologie erweiterbar, da die technischen Schnittstellen zur zentralen Verarbeitungskomponente (z.B. Datenimport Back-End, SPARQL) bestehen bleiben.

GraphScale Fakten

  • Bringt ausdrucksstarkes Schlussfolgern in Triple und Datenbanksysteme
  • Massiv parallele Architektur für hochperformante Verarbeitung
  • In-memory Variante für maximale Geschwindigkeit
  • Schnittstellen zu RDBMs, NoSQL DBs, Tripels Stores
  • Korrekt und vollständig für hoch Audrucksmächtigkeit (OWL 2 RL und mehr)
  • Optimierte SPARQL-Schnittstelle