„Cluster-Dateisystem“ – Versionsunterschied

[ungesichtete Version][ungesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K typo
Keine Bearbeitungszusammenfassung
Zeile 1:Zeile 1:
Der Begriff '''Cluster-Dateisystem''' beschreibt ein [[Dateisystem]], welches im [[Cluster|Rechnercluster]] konkurrierenden Zugriff auf eine [[Shared Storage]] gestattet. Beispiele sind [[Record Management Services|RMS]] ([[VMS|OpenVMS]]), [[AdvFS]] ([[HP]] [[Tru64]]), [[Vertitas ]] (verschiedene Betriebssysteme), [[OCFS]] ([[Linux]] und [[Windows]], jedoch nur für [[Oracle Datenbank|Oracle Datenbanken]]), [[GPFS]] ([[AIX]]), [[Global File System|Sun GFS]] ([[Sun Solaris]]), [[Global File System|Red Hat GFS]] ([[Linux]]) oder [[Polyserve Matrix Server]] ([[Linux]]).
Der Begriff '''Cluster-Dateisystem''' beschreibt ein [[Dateisystem]], welches in einem [[Cluster|Rechnercluster]] konkurrierenden Zugriff auf eine [[Shared Storage]] gestattet. Beispiele sind [[Record Management Services|RMS]] ([[VMS|OpenVMS]]), [[AdvFS]] ([[HP]] [[Tru64]]), [[Vertitas ]] (verschiedene Betriebssysteme), [[OCFS]] ([[Linux]] und [[Windows]], jedoch nur für [[Oracle Datenbank|Oracle Datenbanken]]), [[GPFS]] ([[AIX]]), [[Global File System|Red Hat GFS]] ([[Linux]]) [[CXFS]] ([[IRIX]], [[Linux]], [[Solaris]], [[Mac OS X]] und [[Windows]]) , [[StorNext FS]] ([[Linux]], [[Solaris]], [[HP-UX]], [[AIX]], [[IRIX]], [[Windows]] und in der [[XSan]] Variante auch [[Mac OS X]]) oder [[Polyserve Matrix Server]] ([[Linux]]).


Auf ein Cluster-Dateisystem greifen alle im Cluster befindlichen Rechner direkt ohne Vermittlung eines [[Servers]] zu. Das Dateisystem muß sich dazu auf einem Speichermedium befinden das von alles Rechnern direkt erreichbar ist. Dies wird im allgemeinen durch den Aufbau eines [[Storage Area Network|SAN]] erreicht auf der Basis vin [[Fibre Channel]]. Durch den direkten Zugriff ergibt sich eine bessere [[Performance (Informatik)|Performance]] als bei der Nutzung eines [[Rechnernetz|Netzwerk]]-Dateisystems wie [[NFS]] oder [[CIFS]]. Insbesonder bei [[Datenbank]]en oder Anwendungen die große Datenmengen manipulieren ([[Video]]) ist der Leistungsgewinn erheblich.
Ein [[Server]], der ein Cluster-Dateisystem benutzt, braucht dazu nicht die Dienste eines weiteren Servers, er ist in dieser Hinsicht [[autark]]. Die [[Performance (Informatik)|Performance]] eines Zugriffs auf "eigene" Platten ist im Allgemeinen deutlich besser als bei einem Zugriff über ein [[Rechnernetz|Netzwerk]], der sich beispielsweise für [[Datenbank]]-Dateien nicht empfiehlt.


Um die [[Konsistenz]] der Daten sicherzustellen, muß sichergestellt werden das die Verwaltungsdaten, i.e. Verzeichnisse, Attribute und Speicherplatzzuweisungen (''Metadaten'') koordiniert gespeichert werden. Hierzu wird üblicherweise ein Metadaten-Server eingesetzt, der all diese Daten von den verschiedenen Teilnehmern am Cluster-Dateisystem übermittelt bekommt, üblicherweise über ein [[Ethernet]]. Dieser übernimmt auch die Koordiniertung der [[Cache]]s und der Dateisperren ([[Locks]]). In manchen Cluster-Dateisystemn kann der Metadaten-Server auch andere Aufgaben übernehmen, bei anderen (CXFS) müssen ein oder mehrere dedizierte Metadatenserver eingesetzt werden um die Bertiebssicherheit zu erhöhen.
Um Plattensysteme an mehrere Server zugleich anzubinden, sind geeignete [[Bussystem]]e oder Netzwerke erforderlich. Gängig ist der Aufbau eines '''[[Storage Area Network]] (SAN)''' auf Basis von [[Fibre Channel]]-Verbindungen.

Um die [[Konsistenz]] der Daten sicherzustellen, muss die Sperrverwaltung Server übergreifend abgeglichen werden ([[Synchron]]isierung). Hierzu müssen die Server Sperrinformationen austauschen. Da üblicherweise Informationen über die [[Verzeichnisstruktur]] ("Metadaten") und auch über zuletzt verwendete Dateiinhalte in den [[Cache]]s der einzelnen Server gehalten werden, müssen auch diese synchronisiert werden.


Gelingt den Servern aufgrund einer Störung im Netzwerk die Synchronisation nicht, so besteht die Gefahr von [[Inkonsistenz]]en. Üblicherweise wird das betroffene Dateisystem sich dann auf all jenen Servern herunterfahren, die (sich selbst eingerechnet) nur noch maximal 50% der Gesamtheit an Servern sehen können. Da es nur maximal eine Gruppe geben kann, die mehr als 50% der Server umfasst, bleibt nur diese aktiv, es können keine Inkonsistenzen entstehen.
Gelingt den Servern aufgrund einer Störung im Netzwerk die Synchronisation nicht, so besteht die Gefahr von [[Inkonsistenz]]en. Üblicherweise wird das betroffene Dateisystem sich dann auf all jenen Servern herunterfahren, die (sich selbst eingerechnet) nur noch maximal 50% der Gesamtheit an Servern sehen können. Da es nur maximal eine Gruppe geben kann, die mehr als 50% der Server umfasst, bleibt nur diese aktiv, es können keine Inkonsistenzen entstehen.

Version vom 15. Dezember 2005, 23:18 Uhr

Der Begriff Cluster-Dateisystem beschreibt ein Dateisystem, welches in einem Rechnercluster konkurrierenden Zugriff auf eine Shared Storage gestattet. Beispiele sind RMS (OpenVMS), AdvFS (HP Tru64), Vertitas (verschiedene Betriebssysteme), OCFS (Linux und Windows, jedoch nur für Oracle Datenbanken), GPFS (AIX), Red Hat GFS (Linux) CXFS (IRIX, Linux, Solaris, Mac OS X und Windows) , StorNext FS (Linux, Solaris, HP-UX, AIX, IRIX, Windows und in der XSan Variante auch Mac OS X) oder Polyserve Matrix Server (Linux).

Auf ein Cluster-Dateisystem greifen alle im Cluster befindlichen Rechner direkt ohne Vermittlung eines Servers zu. Das Dateisystem muß sich dazu auf einem Speichermedium befinden das von alles Rechnern direkt erreichbar ist. Dies wird im allgemeinen durch den Aufbau eines SAN erreicht auf der Basis vin Fibre Channel. Durch den direkten Zugriff ergibt sich eine bessere Performance als bei der Nutzung eines Netzwerk-Dateisystems wie NFS oder CIFS. Insbesonder bei Datenbanken oder Anwendungen die große Datenmengen manipulieren (Video) ist der Leistungsgewinn erheblich.

Um die Konsistenz der Daten sicherzustellen, muß sichergestellt werden das die Verwaltungsdaten, i.e. Verzeichnisse, Attribute und Speicherplatzzuweisungen (Metadaten) koordiniert gespeichert werden. Hierzu wird üblicherweise ein Metadaten-Server eingesetzt, der all diese Daten von den verschiedenen Teilnehmern am Cluster-Dateisystem übermittelt bekommt, üblicherweise über ein Ethernet. Dieser übernimmt auch die Koordiniertung der Caches und der Dateisperren (Locks). In manchen Cluster-Dateisystemn kann der Metadaten-Server auch andere Aufgaben übernehmen, bei anderen (CXFS) müssen ein oder mehrere dedizierte Metadatenserver eingesetzt werden um die Bertiebssicherheit zu erhöhen.

Gelingt den Servern aufgrund einer Störung im Netzwerk die Synchronisation nicht, so besteht die Gefahr von Inkonsistenzen. Üblicherweise wird das betroffene Dateisystem sich dann auf all jenen Servern herunterfahren, die (sich selbst eingerechnet) nur noch maximal 50% der Gesamtheit an Servern sehen können. Da es nur maximal eine Gruppe geben kann, die mehr als 50% der Server umfasst, bleibt nur diese aktiv, es können keine Inkonsistenzen entstehen. Man sagt auch, das Quorum liegt bei > 50%.

Aus dem Quorum ergibt sich, dass ein so konfiguriertes Dateisystem mindestens drei Server benötigt, wenn Hochverfügbarkeit erwünscht ist. Diese sollten dann konsequenterweise auch in getrennte Infrastruktur eingebunden sein, das heißt, drei Server-Räume in unterschiedlichen Brandabschnitten, drei unterbrechungsfreie Stromversorgungen usw.

Ein Cluster-Dateisystem, das lediglich eine gemeinsame Datenbasis für eine Vielzahl parallel arbeitender Server dient, muss zwar nicht zwangsläufig hoch verfügbar sein, doch wird man eine solche Server-Farm ohnehin aus viel mehr als zwei Rechnern aufbauen. Die Mehr-Raum-Notwendigkeit stellt sich bei solchen Anwendungen zunächst nicht.

Im Gegensatz zu der weitgehend autarken Position der Server in einem Cluster-Dateisystem steht der Zugriff auf Dateien über ein Netzwerk, z. B. über Network File System (NFS) auf Unix-Systeme, über NetWare von Novell oder über NetBIOS von Microsoft. Hier "gehört" der Plattenplatz einem bestimmten Server, der den Datenzugriff vermittelt. Fällt er aus, ist das betroffenen Dateisystem nicht verfügbar.

Die dritte Möglichkeit des verteilten Zugriffs auf Dateien ist die Verwendung von Raw Devices. Hier verzichtet man ganz auf Dateisysteme und überlässt es der Anwendung, den verfügbaren Platz auf dem betreffenden Plattensystem zu verwalten. Die Anwendung muss also gegebenenfalls die Synchronisation zwischen den Servern durchführen und mit Störungen umgehen. Moderne Betriebssysteme erlauben es, auch Anteile eines physischen Plattensystems als Raw Devices zu benutzen, während andere Anteile für Dateisysteme reserviert werden.

Anmerkung: Die Namen der erwähnten Produkte und Unternehmen sind geschützt.

Siehe auch