고가용성 대 재해 복구 | 완벽하게 설명

IT 시스템 관리에서 하이어베일러빌리티와 디자스터 리커버리의 핵심 차이점을 알아보세요. 하이어베일러빌리티는 다운타임을 최소화하여 애플리케이션에 대한 지속적인 액세스를 보장하는 반면, 디자스터 리커버리는 대규모 사건 발생 후 운영을 복구하는 데 중점을 둡니다.

download-icon
무료 다운로드
for VM, OS, DB, File, NAS, etc.
minjae-han

업데이트 한민재 현재 2025/07/28

목차
  • 하이 애버러빌리티(High Availability)란 무엇인가?

  • 고가용성의 유형

  • 디지털 재해 복구란 무엇인가?

  • 고가용성 대 재해 복구

  • 빈친 솔루션으로 데이터 보호 강화

  • 고가용성과 재해 복구 FAQ

  • 결론

고가용성(HA)과 디자스터 리커버리(DR)는 서비스의 지속적인 운영과 최소한의 다운타임을 보장하기 위해 목표로 하는 IT 시스템 관리의 두 가지 핵심 구성 요소입니다. 경우에 따라서는 이 둘이 서로 바꿔 쓰이기도 하지만, 사실 이들은 서로 다른 전략과 솔루션을 의미합니다.

하이 애버러빌리티(High Availability)란 무엇인가?

하이 애버러빌리티는 로컬 시스템 내 단일 구성 요소의 장애가 발생하더라도, 그 장애가 업무 프로세스, 물리적 시설 또는 IT 소프트웨어/하드웨어 중 어디에 있든 상관없이 애플리케이션에 지속적으로 접근할 수 있는 능력을 의미합니다. 이상적인 가용성 상황은 귀하의 서버 중 하나가 다운되더라도 해당 서비스를 사용하는 사용자가 어떠한 영향도 전혀 느끼지 못하는 경우입니다.

머신이 다운되면 해당 머신에서 실행 중이던 서비스는 반드시 장애 조치를 거쳐야 합니다. 장애 조치의 비용은 두 가지 차원에서 측정되는데, 이는 RTO(복구 시간 목표, Recovery Time Objective)와 RPO(복구 지점 목표, Recovery Point Objective)입니다.

RTO는 서비스가 복구되는 데 걸리는 시간을 의미하며, 가장 이상적인 경우는 0으로, 서비스가 즉시 복구되었음을 나타냅니다. 최악의 경우는 무한대로, 서비스가 전혀 복구되지 않음을 의미합니다. RPO는 장애 전환 중에 복구되는 데이터의 시간 범위를 나타내며, 0은 동기화된 데이터를 사용함을 의미하고, 0보다 크면 데이터 손실이 있음을 뜻합니다. 예를 들어, "RPO = 1일"은 복구 시 하루 전의 데이터를 사용한다는 의미이며, 따라서 그 하루 동안 생성된 모든 데이터는 손실됩니다. 따라서 최적의 복구 결과는 RTO = RPO = 0이지만, 이는 지나치게 이상적이거나 이를 달성하기 위한 비용이 매우 높습니다.

HA의 경우 공유 스토리지가 자주 사용되며, 이를 통해 RPO=0을 달성할 수 있습니다. 동시에 Active/Active HA 모드가 자주 채택되어 RTO를 거의 0으로 만들 수 있습니다. Active/Passive HA 모드를 사용하는 경우라면, RTO를 최소화해야 합니다.

고가용성의 유형

HA는 애플리케이션 및 서비스를 포함한 작업 부하를 실행하기 위해 클러스터를 구성하는 데 사용되는 중복 서버의 사용을 필요로 합니다. 이 중복성은 HA를 두 가지 범주로 나눌 수 있게 합니다:

Active/Passive HA: 이 구성에서는 활성 노드에서만 서비스가 제공됩니다. 활성 노드에 장애가 발생하면 대기 노드의 서비스가 시작되어 활성 노드가 제공하던 서비스를 대체합니다.

Active/Active HA: 이 구성에서는 시스템이 클러스터 내 모든 서버에서 동일한 작업 부하를 실행합니다. 데이터베이스를 예로 들어보면, 한 인스턴스에 대한 업데이트가 모든 인스턴스에 걸쳐 동기화됩니다. 이러한 구성은 종종 부하 분산 소프트웨어를 사용하여 서비스에 대해 가상 IP를 제공합니다.

HA는 서비스를 두 가지 유형으로 분류합니다:

상태 있는 서비스: 서비스에 대한 후속 요청은 이전 요청에 따라 달라집니다.

무상태 서비스: 서비스에 대한 요청은 서로 독립적이며 완전히 자율적입니다.

디지털 재해 복구란 무엇인가?

재해란 인간이나 자연적인 원인으로 인해 갑작스럽게 발생하여 데이터센터 내 정보 시스템에 심각한 오작동이나 마비 현상을 초래하는 사건을 의미합니다. 이로 인해 정보 시스템이 지원하는 업무 기능이 방해되거나 일정 기간 동안 수용할 수 없는 수준의 서비스 상태가 되며, 이에 따라 대체 사이트로 운영을 전환해야 하는 상황이 일반적으로 발생합니다.

디자스터 리커버리 는 재해로 인해 운영 센터가 손상되었을 때, 다른 위치의 데이터 센터에서 데이터, 애플리케이션 또는 업무 기능을 복구할 수 있는 능력을 말합니다.

장애 허용(Disaster Tolerance)이란 사용자가 운영 중인 사이트 외에 추가로 구축한 대체 사이트를 말합니다. 재해가 발생하여 운영 사이트가 손상되었을 때, 이 대체 사이트가 정상적인 업무 운영을 대신 수행하여 업무 연속성을 보장합니다. 더 높은 가용성을 달성하기 위해 많은 사용자들이 여러 개의 대체 사이트를 구축하기도 합니다.

재해 복구 시스템을 측정하는 주요 지표는 두 가지가 있습니다: RPO와 RTO입니다. RPO는 재해 발생 시 허용 가능한 데이터 손실량을 나타내며, RTO는 시스템이 복구되는 데 걸리는 시간을 나타냅니다. RPO와 RTO가 작을수록 시스템의 가용성은 더 높아집니다. 당연히 사용자가 투자해야 하는 비용도 그만큼 커지게 됩니다.

고가용성 대 재해 복구

HA와 DR의 관계는 상호 연결되어 있으며 보완적이지만, 중요한 차이점들이 있습니다:

HA는 일반적으로 장애가 발생했을 때 여러 서버에서 애플리케이션이 끊김 없이 계속 실행될 수 있도록 보장하는 로컬 고가용성 시스템을 의미합니다. 애플리케이션 및 시스템은 다른 서버로 빠르게 전환하여 작업을 계속할 수 있어야 하며, 이는 로컬 시스템 클러스터링 및 핫 장애 전환을 포함합니다. HA는 공유 저장소를 자주 사용하므로 일반적으로 데이터 손실이 없으며(RPO = 0), RTO에 초점을 맞춥니다.

DR은 지리적으로 분산된(동일 도시 내 또는 다른 지역) 고가용성 시스템을 의미하며, 데이터 복제를 이용하여 재해 발생 시 데이터, 애플리케이션 및 업무 운영을 복구할 수 있는 능력을 나타냅니다. 사용되는 데이터 복제 기술(동기식, 비동기식, 스트레치드 클러스터 등)에 따라 종종 일부 데이터 손실이 발생하여 RPO > 0이 되는 경우가 많습니다. 또한 원격 사이트에서 애플리케이션 전환에 걸리는 시간이 일반적으로 더 오래 걸리므로 RTO > 0입니다. 따라서 최적의 총 소유 비용(CTO)을 달성하기 위해 특정 업무 요구 사항에 따라 필요한 RTO 및 RPO를 맞춤화하는 것이 필요합니다. 원격 재해 복구 시스템에는 일반적으로 로컬 HA 클러스터와 원격 DR 데이터 센터가 포함됩니다.

두 가지의 차이점은 다른 관점에서 바라볼 수도 있습니다:

결함의 관점에서 볼 때, HA는 주로 클러스터 내 서버 간 부하 전달을 초래하는 단일 구성 요소의 실패를 다루는 반면, DR은 데이터 센터 간 부하 전달이 필요한 대규모 실패를 해결하기 위해 설계되었습니다.

네트워크 관점에서 볼 때, LAN 수준의 작업 범위는 HA의 영역에 속하는 반면, WAN 수준의 작업 범위는 DR의 범위에 포함됩니다.

클라우드 컴퓨팅 관점에서 HA는 단일 클라우드 환경 내에서 비즈니스 연속성을 보장하기 위한 메커니즘이며, DR은 여러 클라우드 환경 간에 비즈니스 연속성을 보장하기 위한 메커니즘입니다.

빈친 솔루션으로 데이터 보호 강화

빈친 백업 및 복구 는 가상화 환경에서 데이터 보호 및 디지털 재해복구를 제공하도록 설계된 전문 솔루션입니다. 다양한 가상 플랫폼인 VMware, Hyper-V, XenServer, Proxmox, XCP-ng 등 및 데이터베이스, NAS, 파일 서버, Linux 및 Windows Server 등을 지원합니다. 가상 환경에 최적화된 빈친은 자동 백업, 에이전트리스 백업, LAN/LAN-Free 옵션, 사이트 간 복사, 즉시 복구, 중복 데이터 제거 및 클라우드 아카이빙을 제공합니다. 데이터 암호화 및 랜섬웨어 보호 기능 포함.

에이전트리스 백업 기능을 통해 가상 머신을 백업 시스템에 신속하게 통합할 수 있습니다. 백업에서 가상 머신을 몇 초 만에 재시작할 수 있는 인스턴트 복구, 원격 백업 저장을 위한 오프사이트 복사, 무결성 검사를 위한 자동 백업 검증과 같은 재해 복구 기능을 제공합니다. 또한, 다양한 하이퍼바이저 간 가상 머신 마이그레이션을 지원하여 가상 환경 전환을 매끄럽게 해줍니다.

가상 머신을 Vinchin Backup & Recovery로 백업하는 데는 4단계만 필요합니다:

1. 백업 대상을 선택하십시오.

백업 개체 선택

2. 백업 대상 선택.

백업 대상 선택

3. 백업 전략 선택

백업 전략 선택

4.작업을 검토하고 제출하십시오.

작업을 검토하고 제출하세요

이 강력한 시스템의 진가를 60일 무료 체험을 통해 직접 확인해 보세요! 귀하의 구체적인 요구사항을 남겨 주시면, 귀사의 IT 환경에 딱 맞는 맞춤형 솔루션을 제공해 드립니다.

고가용성과 재해 복구 FAQ

1. Q: 고가용성과 오류 허용(Fault Tolerance)의 차이점은 무엇인가요?

A: 두 시스템 모두 지속적인 운영을 보장하는 것을 목표로 하지만, 고가용성은 장애 발생 후 짧은 복구 시간이 필요한 반면, 펄티 톨러런스는 장애 발생 시에도 서비스 중단 없이 계속 서비스를 제공하도록 설계되었습니다.

2. Q: 고가용성(High Availability)과 로드 밸런싱(load balancing)은 동일한가요?

A: 아니요. 하지만 로드 밸런싱은 고가용성(High Availability)의 구성 요소입니다. 여러 컴퓨팅 자원에 걸쳐 작업 부하를 분산시켜, 단일 서버가 장애 지점이 되는 것을 방지하는 데 도움을 줍니다.

3. Q: 재해 복구 계획의 핵심 구성 요소는 무엇인가요?

Q: 종합적인 DR 계획에는 중요 시스템 식별, 데이터 백업 솔루션, 복구 사이트 준비, 명확한 RPO 및 RTO, 상세한 복구 절차가 포함됩니다.

결론

HA는 로컬 설정 내에서 다운타임을 방지하는 것이며, DR은 지리적으로 다른 위치에서 재해가 발생한 후 복구하는 것입니다. 두 개념 모두 지속적인 업무 운영을 보장하는 데 중요하지만, 조직의 리스크 허용 수준, 업무 요구사항, 가용 자원에 따라 다르게 구현됩니다.

공유하기:

카테고리: Disaster Recovery