-
Was ist Hochverfügbarkeit?
-
Arten der hohen Verfügbarkeit
-
Was ist Disaster Recovery?
-
Hohe Verfügbarkeit vs. Katastrophenwiederherstellung
-
Datenschutz mit der Vinchin-Lösung verbessern
-
High Availability vs Disaster Recovery FAQs
-
Schlussfolgerung
Hohe Verfügbarkeit (HA) und Katastrophenwiederherstellung (DR) sind zwei entscheidende Bestandteile des IT-Systemmanagements, deren Ziel es ist, einen kontinuierlichen Betrieb und minimale Ausfallzeiten für Dienste sicherzustellen. Obwohl sie manchmal austauschbar verwendet werden, beziehen sie sich auf unterschiedliche Strategien und Lösungen.
Was ist Hochverfügbarkeit?
Hochverfügbarkeit bezieht sich auf die Fähigkeit, auch bei Ausfall einer einzelnen Komponente im lokalen System weiterhin auf eine Anwendung zugreifen zu können, unabhängig davon, ob der Ausfall in Geschäftsprozessen, physischen Einrichtungen oder IT-Software-/Hardware liegt. Das optimale Szenario für Verfügbarkeit ist, wenn bei einem Ausfall eines Ihrer Geräte die Benutzer Ihres Dienstes keinerlei Auswirkungen spüren.
Wenn Ihre Maschine ausfällt, müssen die auf dieser Maschine laufenden Dienste unbedingt ein Failover durchlaufen. Die Kosten eines Failovers werden anhand zweier Dimensionen gemessen: RTO (Recovery Time Objective) und RPO (Recovery Point Objective).
RTO ist die Zeit, die für die Wiederherstellung eines Dienstes benötigt wird. Der beste Fall ist 0, was bedeutet, dass der Dienst sofort wiederhergestellt wird; der schlimmste Fall ist unendlich, was bedeutet, dass der Dienst niemals wiederhergestellt wird. RPO ist die Zeitspanne der Daten, die während des Wechsels zurückliegen und wiederhergestellt werden; 0 bedeutet die Verwendung synchronisierter Daten, größer als 0 bedeutet, dass Daten verloren gegangen sind. Beispielsweise bedeutet „RPO = 1 Tag“, dass Daten vom Vortag zur Wiederherstellung verwendet werden, wodurch alle Daten innerhalb dieses Tages verloren gehen. Daher ist das optimale Wiederherbungsergebnis RTO = RPO = 0, doch dies ist zu idealistisch oder die Kosten dafür sind zu hoch.
Für HA wird häufig gemeinsam genutzter Speicher verwendet, der ein RPO = 0 ermöglicht. Gleichzeitig wird oft ein Active/Active HA-Modus eingesetzt, um ein nahezu 0 liegendes RTO zu erreichen. Falls ein Active/Passive HA-Modus verwendet wird, muss das RTO minimiert werden.
Arten der hohen Verfügbarkeit
HA erfordert den Einsatz redundanter Server, um einen Cluster zu bilden, der die Workloads einschließlich Anwendungen und Dienste ausführt. Diese Redundanz ermöglicht es ebenfalls, HA in zwei Kategorien einzuteilen:
Aktives/passives Hochverfügbarkeitssystem (HA): Bei dieser Konfiguration werden die Dienste nur auf dem aktiven Knoten angeboten. Wenn der aktive Knoten ausfällt, wird der Dienst auf dem passiven Knoten gestartet, um den vom aktiven Knoten bereitgestellten Dienst zu ersetzen.
Active/Active HA: In dieser Konfiguration führt das System die gleiche Arbeitslast auf allen Servern innerhalb des Clusters aus. Am Beispiel einer Datenbank bedeutet dies, dass Aktualisierungen einer Instanz auf alle Instanzen synchronisiert werden. Diese Konfiguration verwendet häufig Software zur Lastverteilung, um für Dienste eine virtuelle IP-Adresse bereitzustellen.
HA unterteilt Dienste in zwei Arten:
Zustandsbehaftete Dienste: Nachfolgende Anfragen an den Dienst hängen von vorherigen Anfragen ab.
Zustandslose Dienste: Anfragen an den Dienst sind voneinander unabhängig und vollständig autonom.
Was ist Disaster Recovery?
Ein Disaster ist ein plötzliches Ereignis, das auf menschliche oder natürliche Ursachen zurückgeht und zu schwerwiegenden Störungen oder einem Stillstand der Informationssysteme in einem Rechenzentrum führt. Dadurch werden die von den Informationssystemen unterstützten Geschäftsprozesse beeinträchtigt oder die Dienstleistungsqualität erreicht für einen bestimmten Zeitraum ein unakzeptables Niveau, was in der Regel erfordert, den Betrieb auf eine alternative Site zu verlagern.
Disaster Recovery ist die Fähigkeit, Daten, Anwendungen oder Geschäftsfunktionen in einem Rechenzentrum an einem anderen Standort wiederherzustellen, wenn eine Katastrophe das Produktionszentrum beeinträchtigt.
Unter Disaster-Toleranz versteht man die von Benutzern zusätzlich zum Produktionsstandort eingerichteten redundanten Standorte. Wenn eine Katastrophe eintritt und der Produktionsstandort beschädigt wird, kann der redundante Standort die normalen Geschäftsvorgänge übernehmen, um die Geschäftskontinuität sicherzustellen. Um eine höhere Verfügbarkeit zu erreichen, richten viele Benutzer sogar mehrere redundante Standorte ein.
Es gibt zwei Hauptkennzahlen zur Bewertung eines Disaster-Recovery-Systems: RPO und RTO. RPO steht für die akzeptable Menge an Datenverlust bei einem Disaster, während RTO die Zeit beschreibt, die für die Wiederherstellung des Systems benötigt wird. Je kleiner die Werte für RPO und RTO sind, desto höher ist die Verfügbarkeit des Systems. Logischerweise ist dabei jedoch auch ein höherer Invest erforderlich.
Hohe Verfügbarkeit vs. Katastrophenwiederherstellung
Die Beziehung zwischen HA und DR ist miteinander verbunden und ergänzend, dennoch gibt es wesentliche Unterschiede:
HA bezieht sich typischerweise auf ein lokales Hochverfügbarkeitssystem, das sicherstellt, dass Anwendungen bei einem Ausfall eines Servers ohne Unterbrechung auf mehreren Servern weiterlaufen. Die Anwendungen und Systeme sollten schnell auf andere Server umschalten können, um den Betrieb fortzusetzen. Dies umfasst lokales System-Clustering und Hot-Failover. HA verwendet häufig gemeinsam genutzte Speicher, sodass in der Regel kein Datenverlust auftritt (RPO = 0), wobei der Schwerpunkt stärker auf der RTO liegt.
DR bezeichnet ein hochverfügbares System, das geografisch verteilt ist (entweder innerhalb derselben Stadt oder an einem anderen Standort) und beschreibt die Fähigkeit, Daten, Anwendungen und Geschäftsprozesse im Falle einer Katastrophe mithilfe von Datenreplikation wiederherzustellen. Je nach verwendeter Datenreplikationstechnologie (synchron, asynchron, Stretched Cluster usw.) kommt es oft zu einem gewissen Datenverlust, wodurch ein RPO > 0 entsteht. Zudem dauert der Wechsel zu Anwendungen an einem Remote-Standort in der Regel länger, weshalb auch ein RTO > 0 vorliegt. Daher ist es erforderlich, die erforderlichen RTO- und RPO-Werte basierend auf den spezifischen Geschäftsanforderungen anzupassen, um die optimale Total Cost of Ownership (TCO) zu erreichen. Ein Remote-Disaster-Recovery-System umfasst oft einen lokalen HA-Cluster und ein Remote-DR-Rechenzentrum.
Die Unterschiede zwischen den beiden können auch aus anderen Perspektiven betrachtet werden:
Aus Sicht der Fehler hat HA hauptsächlich mit dem Ausfall einzelner Komponenten zu tun, wodurch die Lasten zwischen Servern innerhalb eines Clusters transferiert werden, während DR darauf ausgelegt ist, Großausfälle zu bewältigen, bei denen die Lasten zwischen Rechenzentren transferiert werden müssen.
Aus Sicht des Netzwerks sind Aufgaben im LAN-Bereich Aufgabe der HA, während Aufgaben im WAN-Bereich in den Zuständigkeitsbereich der DR fallen.
Aus Sicht der Cloud-Computing-HA ist ein Mechanismus innerhalb einer Cloud-Umgebung, um die Geschäftskontinuität zu gewährleisten, während DR ein Mechanismus zwischen mehreren Cloud-Umgebungen ist, um die Geschäftskontinuität zu gewährleisten.
Datenschutz mit der Vinchin-Lösung verbessern
Vinchin Backup & Recovery ist eine professionelle Lösung, die zum Schutz von Daten und zur Wiederherstellung nach Katastrophen in virtualisierten Umgebungen entwickelt wurde. Sie unterstützt verschiedene virtuelle Plattformen wie VMware, Hyper-V, XenServer, Proxmox, XCP-ng, etc., sowie Datenbanken, NAS, Dateiserver, Linux & Windows Server, etc. Speziell für virtuelle Umgebungen konzipiert, bietet Vinchin automatische Sicherungen, agentenlose Sicherung, LAN-/LAN-freie Optionen, Offsite-Kopie, sofortige Wiederherstellung, Datendeduplizierung und Cloud-Archivierung. Mit Datenverschlüsselung und Ransomware-Schutz.
Mit der funktionellen, agentenlosen Datenspiecherung ermöglicht es eine schnelle Integration von virtuellen Maschinen in das Datenspiecherungssystem. Es bietet Funktionen zur Wiederherstellung nach Katastrophen, wie z. B. Sofortwiederherstellung, um virtuelle Maschinen innerhalb von Sekunden aus Sicherungskopien neu zu starten, externe Speicherung zur Erstellung von Sicherungskopien am Remote-Standort und automatische Verifikation der Sicherungskopien zur Überprüfung der Datenintegrität. Zusätzlich ermöglicht es die Migration virtueller Maschinen über verschiedene Hypervisoren hinweg, um den nahtlosen Wechsel zwischen virtuellen Umgebungen zu erleichtern.
Es dauert nur 4 Schritte, um Ihre virtuelle Maschine mit Vinchin Backup & Recovery zu sichern:
1. Wählen Sie das Sicherungsobjekt aus.
2. Sicherungsort auswählen.
3. Wählen Sie Backup-Strategien aus.
4. Prüfen und Auftrag abschicken.
Erleben Sie die Kraft dieses umfassenden Systems hautnah mit einer kostenlosen 60-Tage-Testversion! Hinterlassen Sie Ihre spezifischen Anforderungen, und Sie erhalten eine maßgeschneiderte Lösung, die perfekt zu Ihrer IT-Umgebung passt.
High Availability vs Disaster Recovery FAQs
1. Frage: Was ist der Unterschied zwischen High Availability und Fehlertoleranz?
A: Während beide darauf abzielen, einen kontinuierlichen Betrieb sicherzustellen, beinhaltet Hochverfügbarkeit eine kurze Wiederherstellungszeit nach einem Ausfall, während Fehlertoleranz darauf ausgelegt ist, auch während eines Ausfalls eine unterbrechungsfreie Dienstleistung ohne Ausfallzeit bereitzustellen.
2. Frage: Ist Hochverfügbarkeit dasselbe wie Lastverteilung?
A: Nein, aber Load Balancing ist ein Bestandteil von High Availability. Es verteilt Arbeitslasten auf mehrere Rechenressourcen und hilft dabei, sicherzustellen, dass kein einzelner Server zu einem Single Point of Failure wird.
3. Frage: Welches sind die wesentlichen Bestandteile eines Notfallwiederherstellungsplans?
A: Ein umfassender DR-Plan beinhaltet die Identifizierung kritischer Systeme, Lösungen für Datensicherungen, Regelungen für eine Wiederherstellungsstelle, klare RPO- und RTO-Vorgaben sowie detaillierte Wiederherstellungsverfahren.
Schlussfolgerung
HA geht darum, Ausfallzeiten innerhalb einer lokalen Einrichtung zu verhindern, während DR die Wiederherstellung nach einem Ereignis beinhaltet, möglicherweise an einem anderen geografischen Standort. Beide sind entscheidend, um kontinuierliche Geschäftsvorgänge sicherzustellen, werden jedoch unterschiedlich umgesetzt, abhängig von der Risikotoleranz, den geschäftlichen Anforderungen und den verfügbaren Ressourcen eines Unternehmens.
Teilen auf: