Um die Anfrageausführung in Datenbanksystemen zu optimieren, können materialisierte Sichten eingesetzt werden. Dabei müssen Veränderungen ihrer Basisrelationen jedoch auf die Sichten übertragen werden, um ihre Zustände konsistent zu halten. Die vorliegende Arbeit fokussiert das Sichtwartungsproblem und betrachtet dessen orthogonale Aspekte, welche die Art und Weise und den Zeitpunkt der Wartung betreffen, sowie die Vor- und Nachteile ihrer Anwendung. Die inkrementelle, verzögerte Wartungsstrategie steht dabei im Mittelpunkt der Darstellung. Bereits vor der Anwendung eines Wartungsalgorithmus’ können die für eine Sicht irrelevanten Veränderungen ihrer Basisrelationen von der Wartung ausgeschlossen werden. Je nach Sichtdefinition existieren anschließend unterschiedliche Verfahren, welche miteinander kombiniert, die inkrementelle Wartung materialisierter SPJ und SPOJ Sichten erlauben. Ein verzögerter Wartungszeitpunkt ermöglicht zudem die Entkopplung des Wartungsprozesses von der verändernden Transaktion, sodass diese nicht die Wartungskosten tragen muss. Mit dem in dieser Arbeit vorgestellten Algorithmen und Verfahren können irrelevante und redundante Veränderungen vor der stattfindenden Sichtwartung entfernt werden, weshalb eine inkrementelle, verzögerte Wartungsstrategie eine effiziente Aktualisierung materialisierter Sichten erlaubt.
Inhaltsverzeichnis
1 EINLEITUNG
1.1 Themengrundlage
1.2 Problemstellung
1.3 Ziel und Ausrichtung der Arbeit
1.4 Struktur der Arbeit
1.5 Nomenklatur und Annahmen
1.6 Definition der verwendeten Beispielsicht
2 GRUNDLAGEN - MATERIALISIERTE SICHTEN
2.1 Unterschiede zwischen nicht materialisierten und materialisierten Sichten
2.2 Anwendung mit Vor- und Nachteilen
3 KLASSIFIZIERUNG VON ASPEKTEN DER SICHTWARTUNG
3.1 Überblick
3.2 Wartungsverfahren
3.2.1 Vollständige Aktualisierung
3.2.2 Inkrementelle Aktualisierung
3.3 Wartungszeitpunkt
3.3.1 Sofortige Aktualisierung
3.3.2 Transaktionsbasierte Aktualisierung
3.3.3 Verzögerte Aktualisierung
4 INKREMENTELLE WARTUNGSVERFAHREN
4.1 Relevante und irrelevante Veränderungen auf Basistabellen
4.1.1 Relevanz und deren Überprüfbarkeit
4.1.2 Irrelevante Veränderungen durch INSERT Anweisungen
4.1.3 Irrelevante Veränderungen durch DELETE Anweisungen
4.1.4 Verfahren zum Filtern relevanter Veränderungen
4.1.5 Verwandte Literatur
4.2 Wartungsverfahren für einfache Sichtdefinitionen
4.2.1 SELECT Sichtdefinitionen
4.2.2 PROJECT Sichtdefinitionen
4.2.3 INNER JOIN Sichtdefinitionen
4.2.3.1 Veränderungen einer Basisrelation
4.2.3.2 Veränderungen mehrerer Basisrelationen
4.2.4 OUTER JOIN Sichtdefinitionen
4.2.4.1 Allgemeines Wartungsschema
4.2.4.2 Berechnung der direkten Veränderungen
4.2.4.3 Berechnung der indirekten Veränderungen
4.2.4.4 Offene Fragen
4.3 Wartungsverfahren für kombinierte Sichtdefinitionen
4.4 Weitere Möglichkeiten zur Effizienzsteigerung
4.5 Fazit und offene Fragen
5 VERZÖGERTE WARTUNGSSTRATEGIE
5.1 Allgemeines Wartungsschema
5.2 Grundlagen
5.2.1 Annahmen
5.2.2 Transaktionen unter Snapshot Isolation und Tupelversionierung
5.2.3 Wartungsaufträge
5.3 Berechnen von Sichtveränderungen
5.4 Redundante Sichtveränderungen
5.3.1 Entstehung
5.3.2 Umgehen redundanter Wartungsoperationen
5.4 Weitere Möglichkeiten zur Effizienzsteigerung
5.5 Verwandte Literatur
5.6 Fazit & Offene Fragen
6 KOMBINIERBARKEIT DER ASPEKTE DER SICHTWARTUNG
7 ZUSAMMENFASSUNG
Zielsetzung & Themen
Die Arbeit untersucht die verschiedenen Ansätze zur effizienten Wartung von materialisierten Sichten in Datenbanksystemen. Dabei liegt der Fokus auf der Klassifizierung und systematischen Darstellung von Wartungsverfahren (vollständig oder inkrementell) und Wartungszeitpunkten (sofort, transaktionsbasiert oder verzögert) sowie deren Kombination, um Anfragezeiten zu optimieren und Wartungskosten zu minimieren.
- Materialisierte Sichten und ihre Rolle in der Anfrageoptimierung
- Methoden der inkrementellen Sichtwartung bei verschiedenen Sichtdefinitionen (Join, Project, Select, Outer Join)
- Konzepte der verzögerten Wartungsstrategie unter Verwendung von Transaktionen und Snapshot Isolation
- Ansätze zur Effizienzsteigerung durch Filterung redundanter und irrelevanter Veränderungen
- Kombinierbarkeit der verschiedenen Aspekte der Sichtwartung
Auszug aus dem Buch
1.1 Themengrundlage
Zu Beginn der 80er Jahre löste das relationale Datenbankmodell die bisher vorherrschenden hierarchischen und netzwerkartigen Datenorganisationsmodelle auf dem Markt ab. So wurde beispielsweise die IT von Konzernen oder mittelständischen Unternehmen zur Verwaltung von Kundendaten auf Datenbanksysteme umgestellt. Mit zunehmender Größe der zu verwaltenden Datenmengen und deren dezentralen Speicherung wurden zentrale Datenlager geschaffen, welche heute als Data-Warehouses bekannt sind. In ihnen werden aktuelle und historische Datenbestände heterogener Quellsysteme integriert, analysiert und ausgewertet. Damit speichern Data-Warehouses nicht nur Daten für Unternehmen, sondern helfen auch bei der betriebswirtschaftlichen Entscheidungsfindung, indem beispielsweise Kunden-, Markt- oder Trendanalysen durchgeführt werden können [Le02]. Nicht nur mit zunehmenden Datenmengen und der Nutzung verteilter Systeme, sondern auch mit ansteigender Komplexität der an ein Verwaltungssystem gestellten Anfragen, wurden neue Techniken nötig, um die Anfrageausführung schneller und effizienter zu gestalten. Die Verwendung von materialisierten Sichten in Datenbanksystemen trägt zu dieser Anfrageoptimierung bei.
Zusammenfassung der Kapitel
1 EINLEITUNG: Führt in die Grundlagen materialisierter Sichten ein, definiert die Problemstellung der Sichtwartung und legt die Struktur der Arbeit fest.
2 GRUNDLAGEN - MATERIALISIERTE SICHTEN: Erläutert den Unterschied zwischen virtuellen und materialisierten Sichten und diskutiert deren Vor- und Nachteile in Bezug auf Wartungsaufwand und Anfrageperformance.
3 KLASSIFIZIERUNG VON ASPEKTEN DER SICHTWARTUNG: Kategorisiert die Wartungsproblematik in die zwei orthogonalen Aspekte der Wartungsverfahren (vollständig vs. inkrementell) und Wartungszeitpunkte.
4 INKREMENTELLE WARTUNGSVERFAHREN: Detailliert die Algorithmen für die inkrementelle Wartung verschiedener Sichttypen und präsentiert Verfahren zur Filterung irrelevanter Datenänderungen.
5 VERZÖGERTE WARTUNGSSTRATEGIE: Behandelt die Strategien zur verzögerten Sichtaktualisierung unter Annahme von Snapshot Isolation sowie Methoden zur Kompression von Wartungsaufträgen.
6 KOMBINIERBARKEIT DER ASPEKTE DER SICHTWARTUNG: Diskutiert, wie die verschiedenen Verfahren und Zeitpunkte der Sichtwartung kombiniert werden können, um das Gesamtsystem zu optimieren.
7 ZUSAMMENFASSUNG: Fasst die Kernergebnisse der Arbeit zusammen und bewertet die Anwendbarkeit der vorgestellten Strategien.
Schlüsselwörter
Materialisierte Sichten, Sichtwartung, Inkrementelle Aktualisierung, Anfrageoptimierung, Data-Warehouses, Datenbankverwaltung, Transaktionsbasierte Wartung, Verzögerte Wartungsstrategie, Snapshot Isolation, Sichtdefinition, View Maintenance, Relationale Algebra, Wartungsalgorithmus, Datenbank-Performance, Konsistenz
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Bachelorarbeit behandelt das Problem der effizienten Wartung von materialisierten Sichten in relationalen Datenbanksystemen, um die Anfrageausführung zu beschleunigen.
Welches sind die zentralen Themenfelder der Arbeit?
Zentrale Themen sind die Kategorisierung von Wartungsverfahren und -zeitpunkten, die inkrementelle Aktualisierung von Sichten unter verschiedenen Bedingungen sowie Strategien zur Effizienzsteigerung durch Reduzierung von Wartungsaufwänden.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist die Darstellung und Klassifizierung der orthogonalen Aspekte von Wartungsverfahren und Zeitpunkten bei materialisierten Sichten, um Entscheidungshilfen für deren effiziente Anwendung in der Praxis zu bieten.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit nutzt die Analyse und formale Definition mittels relationaler Algebra, um Algorithmen zur Wartung von Sichten zu entwickeln, und bewertet diese anhand theoretischer Konzepte und Beispielberechnungen.
Was wird im Hauptteil behandelt?
Der Hauptteil gliedert sich in die Klassifizierung der Wartungsaspekte, die detaillierte Vorstellung inkrementeller Verfahren für diverse Sichttypen (Join, Select, Project, Outer Join) und die Analyse verzögerter Wartungsstrategien.
Durch welche Schlüsselwörter lässt sich die Arbeit am besten charakterisieren?
Die wichtigsten Begriffe sind materialisierte Sichten, View Maintenance, inkrementelle Aktualisierung, Anfrageoptimierung und Datenbankkonsistenz.
Wie unterscheidet sich die "verzögerte Wartungsstrategie" von der "sofortigen Aktualisierung"?
Während bei der sofortigen Aktualisierung Sichten direkt im Kontext der verändernden Transaktion angepasst werden, entkoppelt die verzögerte Strategie die Wartung von der verursachenden Transaktion, was die Wartungskosten für die laufende Transaktion reduziert.
Welchen Zweck erfüllt die Filterung "irrelevanter Veränderungen" in Kapitel 4?
Die Filterung dient dazu, Änderungen an Basisdaten, die keinen Einfluss auf das Ergebnis einer definierten Sicht haben, vorab zu identifizieren und den Wartungsprozess somit unnötiger Berechnungen zu entlasten.
Was genau versteht man unter einer "redundanten Wartungsoperation"?
Redundante Wartungsoperationen entstehen, wenn mehrere Änderungen an Basisrelationen dazu führen, dass dieselbe Sichteinheit mehrfach aktualisiert werden müsste; der Wartungsalgorithmus fasst diese zu einer einzigen, effizienten Operation zusammen.
- Arbeit zitieren
- Peggy Werner (Autor:in), 2008, Inkrementelle Wartung materialisierter Sichten, München, GRIN Verlag, https://www.grin.com/document/192518