This diploma thesis deals with high availibility specially on open source software. A short brief explained why using open source software. Availibilty and other operating figures will be defined. Measureplans to solve this problem were made by German Bundesamt fuer Sicherheit in der Informationstechnik and the IT infrastructure library. DRBD and iSCSI were used to realize a small prized storage attached network. Different kind of database clusters using MySQL. Heartbeat and Linux Virtual Server are needed for high availibility and loadbalancing. Some examples shows how to reach high availibility on low costs with open source software.
Inhaltsverzeichnis
- 1 Einleitung
- 1.1 Motivation zu dieser Arbeit
- 1.2 Warum Open Source Software?
- 1.3 Allgemeine Voraussetzungen zur Arbeit
- 1.4 Konventionsvereinbarung
- 2 Grundlagen
- 2.1 Verfügbarkeit
- 2.1.1 Definition und Kennzahlen
- 2.1.2 Gründe der Nichtverfügbarkeit
- 2.1.3 Messverfahren
- 2.2 RAID
- 2.2.1 RAID Level
- 2.2.2 Datenverlust im RAID
- 2.2.3 Hardware-RAID
- 2.2.4 Software-RAID
- 2.3 DRBD
- 2.3.1 Funktionsweise
- 2.3.2 Installation
- 2.4 iSCSI
- 2.4.1 Funktionsweise
- 2.4.2 iSCSI-Target
- 2.4.3 iSCSI-Initiator
- 2.5 Cluster
- 2.5.1 Active-Passive Cluster
- 2.5.2 Active-Active Cluster
- 2.5.3 Load-Balanced Cluster
- 2.5.4 High Performance Cluster
- 2.6 Heartbeat
- 2.6.1 Funktionsweise
- 2.6.2 Installation
- 2.6.3 Konfiguration
- 2.6.4 Fehlerszenarien
- 2.7 Storage
- 2.7.1 SAN versus NAS
- 2.7.2 Storage-Based Mirroring
- 2.7.3 Host-Based Mirroring
- 2.7.4 Dateisysteme
- 2.8 Literaturkritik
- 3 Hochverfügbarkeitsszenarien
- 3.1 Hochverfügbare Speicherlösung
- 3.1.1 Funktionsweise Shared Storage
- 3.1.2 Konfiguration
- 3.2 Datenbank-Cluster mit MySQL
- 3.2.1 Failover mit Shared Storage
- 3.2.2 Redundanz durch Replikation
- 3.2.3 Network Database Cluster
- 3.3 Sichere Webanwendungen
- 3.3.1 Linux Virtual Server
- 3.3.2 Apache Webserver
- 3.4 Zusammenfassung
Zielsetzung und Themenschwerpunkte
Diese Diplomarbeit befasst sich mit Hochverfügbarkeitsstrategien, insbesondere im Kontext von Open-Source-Software. Die Arbeit untersucht die Vorteile der Verwendung von Open-Source-Software und definiert wichtige Kennzahlen zur Messung der Verfügbarkeit. Sie analysiert verschiedene Ansätze zur Erreichung hoher Verfügbarkeit, die von deutschen Behörden wie dem Bundesamt für Sicherheit in der Informationstechnik und der IT-Infrastruktur-Bibliothek vorgeschlagen werden. Die Arbeit präsentiert praktische Beispiele für die Implementierung von Hochverfügbarkeitslösungen unter Verwendung von Technologien wie DRBD, iSCSI, MySQL-Clustern, Heartbeat und Linux Virtual Server. Das Ziel ist es, aufzuzeigen, wie sich mit Open-Source-Software kostengünstige Hochverfügbarkeitslösungen realisieren lassen.
- Einsatz von Open-Source-Software für Hochverfügbarkeit
- Definition und Messung der Verfügbarkeit
- Analyse von Hochverfügbarkeitsansätzen
- Praktische Implementierung von Hochverfügbarkeitslösungen
- Kostenoptimierung durch Open-Source-Lösungen
Zusammenfassung der Kapitel
Kapitel 1 führt in das Thema der Diplomarbeit ein und erläutert die Motivation und den Hintergrund der Arbeit. Es werden die Vorteile von Open-Source-Software im Kontext der Hochverfügbarkeit beleuchtet und die allgemeinen Voraussetzungen für die Arbeit dargelegt. Kapitel 2 behandelt die grundlegenden Konzepte der Verfügbarkeit, RAID-Systeme, DRBD, iSCSI, Cluster-Technologien, Heartbeat und Storage-Systeme. Kapitel 3 beschäftigt sich mit verschiedenen Hochverfügbarkeitsszenarien, darunter hochverfügbare Speicherlösungen, Datenbank-Cluster mit MySQL und sichere Webanwendungen. Das Kapitel beleuchtet die Funktionsweise und Konfiguration dieser Szenarien und zeigt praktische Beispiele für die Implementierung.
Schlüsselwörter
Hochverfügbarkeit, Open Source Software, DRBD, iSCSI, MySQL Cluster, Heartbeat, Linux Virtual Server, Verfügbarkeit, Redundanz, Failover, Load Balancing, Storage, SAN, NAS, Datenbank-Cluster, Webanwendungen.
Häufig gestellte Fragen
Was bedeutet Hochverfügbarkeit in der IT?
Hochverfügbarkeit bezeichnet die Fähigkeit eines Systems, bei Ausfällen von Komponenten den Betrieb nahezu unterbrechungsfrei aufrechtzuerhalten, oft gemessen in Prozent der Betriebszeit.
Warum ist Open-Source-Software für Hochverfügbarkeit attraktiv?
Open-Source-Lösungen bieten hohe Flexibilität, keine Lizenzgebühren und eine große Community, was kostengünstige und dennoch professionelle HA-Strategien ermöglicht.
Was ist DRBD und wie funktioniert es?
DRBD (Distributed Replicated Block Device) ist eine Software-Lösung für Linux, die Festplatteninhalte über das Netzwerk zwischen Servern spiegelt, ähnlich einem Netzwerk-RAID-1.
Welche Rolle spielt Heartbeat in einem Cluster?
Heartbeat überwacht die Erreichbarkeit der Cluster-Knoten und steuert im Falle eines Fehlers den Failover, also das automatische Übernehmen der Dienste durch einen Ersatzserver.
Was ist der Unterschied zwischen einem Active-Passive und einem Active-Active Cluster?
Im Active-Passive Cluster wartet ein Server auf den Ausfall des anderen, während im Active-Active Cluster beide Server gleichzeitig Anfragen verarbeiten und sich gegenseitig sichern.
Wie wird ein hochverfügbarer MySQL-Datenbank-Cluster realisiert?
Dies kann durch Replikation, Shared Storage Lösungen oder spezielle Technologien wie den MySQL Network Database Cluster erreicht werden.
- Quote paper
- Diplom-Wirtschaftsinformatiker (FH) Michael Gläß (Author), 2009, Hochverfügbarkeitsstrategien auf Open-Source-Basis, Munich, GRIN Verlag, https://www.grin.com/document/167307