-
O que é Alta Disponibilidade?
-
Tipos de Alta Disponibilidade
-
O que é Recuperação de Desastres?
-
Alta Disponibilidade vs Recuperação de Desastres
-
Melhore a proteção de dados com a solução Vinchin
-
Alta Disponibilidade vs Recuperação de Desastres Perguntas Frequentes
-
Conclusão
A alta disponibilidade (HA) e a recuperação de desastres (DR) são dois componentes críticos da gestão de sistemas de TI que visam garantir a operação contínua e o tempo de inatividade mínimo para serviços. Embora sejam às vezes utilizados de forma intercambiável, eles se referem a estratégias e soluções diferentes.
O que é Alta Disponibilidade?
Alta disponibilidade refere-se à capacidade de continuar acessando um aplicativo em caso de falha de um único componente no sistema local, independentemente de a falha estar nos processos empresariais, nas instalações físicas ou no software/hardware de TI. O melhor cenário de disponibilidade é quando uma das suas máquinas para de funcionar e os usuários que utilizam o seu serviço não sentem impacto algum.
Quando sua máquina falhar, os serviços que estão em execução nessa máquina certamente precisarão passar por um failover. O custo do failover é medido em duas dimensões: RTO (Recovery Time Objective) e RPO (Recovery Point Objective).
O RTO é o tempo que um serviço leva para se recuperar, sendo o melhor cenário igual a 0, o que significa que o serviço é restaurado imediatamente; o pior cenário é o infinito, o que significa que o serviço nunca se recupera. O RPO é o período de tempo dos dados que são recuperados durante a mudança; 0 significa usar dados sincronizados, maior que 0 significa que há perda de dados. Por exemplo, "RPO = 1 dia" significa usar dados de um dia antes da falha para recuperação, assim, quaisquer dados dentro desse período são perdidos. Portanto, o resultado ideal de recuperação é RTO = RPO = 0, mas isso é muito idealista ou o custo para alcançá-lo é muito elevado.
Para HA, o armazenamento compartilhado é frequentemente utilizado, o que permite um RPO = 0. Ao mesmo tempo, um modo HA Ativo/Ativo é frequentemente empregado para alcançar um RTO próximo a 0. Se um modo HA Ativo/Passivo for utilizado, então o RTO precisa ser minimizado.
Tipos de Alta Disponibilidade
A Alta Disponibilidade (HA) requer o uso de servidores redundantes para formar um cluster que execute a carga de trabalho, incluindo aplicações e serviços. Essa redundância também permite que a HA seja dividida em duas categorias:
HA Ativo/Passivo: Nesta configuração, os serviços são oferecidos apenas no nó ativo. Quando o nó ativo falha, o serviço no nó passivo é iniciado para substituir o serviço fornecido pelo nó ativo.
HA Ativo/Ativo: Nesta configuração, o sistema executa a mesma carga de trabalho em todos os servidores dentro do cluster. Tomando um banco de dados como exemplo, as atualizações de uma instância são sincronizadas em todas as instâncias. Essa configuração geralmente utiliza software de balanceamento de carga para fornecer um IP virtual para os serviços.
HA categoriza os serviços em dois tipos:
Serviços com Estado: Solicitações subsequentes ao serviço dependem de solicitações anteriores.
Serviços sem estado: As solicitações ao serviço são independentes umas das outras e totalmente autônomas.
O que é Recuperação de Desastres?
Desastre refere-se a um evento súbito que ocorre devido a causas humanas ou naturais, resultando em uma falha grave ou paralisação dos sistemas de informação dentro de um centro de dados. Isso interrompe as funções empresariais suportadas pelos sistemas de informação ou reduz os níveis de serviço a um estado inaceitável por um período específico, exigindo normalmente a transferência das operações para um local alternativo.
Recuperação de Desastres é a capacidade de restaurar dados, aplicações ou capacidades empresariais em um centro de dados de outra localidade quando um desastre afeta o centro de produção.
A tolerância a desastres refere-se ao site redundante estabelecido pelos usuários além do site de produção. Quando ocorre um desastre e o site de produção é danificado, o site redundante pode assumir as operações normais do negócio, garantindo a continuidade das atividades. Para alcançar uma disponibilidade ainda maior, muitos usuários chegam até a estabelecer múltiplos sites redundantes.
Existem duas métricas principais para medir um sistema de recuperação de desastres: RPO e RTO. O RPO representa a quantidade de perda de dados que é aceitável quando ocorre um desastre, enquanto o RTO representa o tempo necessário para o sistema se recuperar. Quanto menores forem o RPO e o RTO, maior será a disponibilidade do sistema. Naturalmente, maior será o investimento exigido pelo usuário.
Alta Disponibilidade vs Recuperação de Desastres
A relação entre HA e DR é interconectada e complementar, apesar de apresentarem diferenças significativas:
HA normalmente se refere a um sistema local de alta disponibilidade que garante que aplicações continuem em execução sem interrupção em múltiplos servidores, no caso de falha de qualquer um dos servidores. As aplicações e sistemas devem ser capazes de mudar rapidamente para outros servidores e continuar as operações, o que envolve agrupamento de sistemas locais e failover imediato. HA utiliza frequentemente armazenamento compartilhado, portanto geralmente não há perda de dados (RPO = 0), com maior foco no RTO.
DR refere-se a um sistema de alta disponibilidade que está geograficamente distribuído (seja dentro da mesma cidade ou em um local diferente) e indica a capacidade de recuperar dados, aplicações e operações comerciais em caso de desastre por meio da replicação de dados. Dependendo da tecnologia de replicação utilizada (síncrona, assíncrona, Stretched Cluster, etc.), geralmente há alguma perda de dados, resultando em RPO > 0. Além disso, a transferência das aplicações para um local remoto geralmente leva mais tempo, portanto, RTO > 0. Assim, é necessário personalizar os valores de RTO e RPO necessários com base nas necessidades específicas do negócio, a fim de obter o custo total de propriedade (CTO) ideal. Um sistema remoto de recuperação de desastres geralmente inclui um cluster HA local e um centro de dados DR remoto.
As diferenças entre os dois também podem ser vistas de outras perspectivas:
Do ponto de vista das falhas, HA lida principalmente com a falha de componentes individuais que levam à transferência de cargas entre servidores dentro de um cluster, enquanto DR é projetado para abordar falhas em grande escala que exigem a transferência de cargas entre centros de dados.
Do ponto de vista da rede, tarefas dentro da escala de uma LAN são de responsabilidade do HA, enquanto tarefas na escala de uma WAN estão dentro do escopo do DR.
Do ponto de vista da computação em nuvem, HA é um mecanismo dentro de um ambiente de nuvem para garantir a continuidade dos negócios, enquanto DR é um mecanismo entre múltiplos ambientes de nuvem para garantir a continuidade dos negócios.
Melhore a proteção de dados com a solução Vinchin
Vinchin Backup & Recovery é uma solução profissional projetada para oferecer proteção de dados e recuperação de desastres em ambientes virtualizados. Ele suporta várias plataformas virtuais como VMware, Hyper-V, XenServer, Proxmox, XCP-ng, etc., além de bancos de dados, NAS, servidores de arquivos, Linux & Windows Server, entre outros. Personalizado para ambientes virtualizados, o Vinchin oferece backups automatizados, backup sem agente, opções LAN/LAN-Free, cópia remota, recuperação instantânea, deduplicação de dados e arquivamento na nuvem. Com criptografia de dados e proteção contra ransomware.
Com o recurso de backup sem agente, permite a rápida integração de máquinas virtuais ao sistema de backup. Oferece recursos de recuperação de desastres, como Restauração Instantânea para reiniciar máquinas virtuais a partir de backups em segundos, cópia remota para armazenamento de backup em local distante e verificação automática de backup para cheques de integridade. Além disso, facilita a migração de máquinas virtuais entre diferentes hipervisores para transições contínuas entre ambientes virtuais.
Para fazer o backup da sua máquina virtual com o Vinchin Backup & Recovery, são necessários apenas 4 passos:
1. Selecione o objeto de backup.
2.Selecione o destino do backup.
3.Selecione estratégias de backup.
4.Revisão e envio do trabalho.
Descubra o poder deste sistema completo em primeira mão com uma avaliação gratuita de 60 dias! Deixe sua necessidade específica, e você receberá uma solução personalizada que se adapta perfeitamente ao seu ambiente de TI.
Alta Disponibilidade vs Recuperação de Desastres Perguntas Frequentes
1. Q: Qual é a diferença entre Alta Disponibilidade e Tolerância a Falhas?
A: Embora ambos visem garantir a operação contínua, Alta Disponibilidade envolve um tempo curto de recuperação após uma falha, enquanto Tolerância a Falhas é projetada para fornecer serviço ininterrupto mesmo durante uma falha, sem tempo de inatividade.
2. Q: Alta Disponibilidade é o mesmo que balanceamento de carga?
A: Não, mas o balanceamento de carga é um componente da Alta Disponibilidade. Ele distribui as cargas de trabalho por meio de múltiplos recursos computacionais, ajudando a garantir que nenhum servidor individual se torne um ponto de falha.
3. Q: Quais são os componentes principais de um Plano de Recuperação de Desastres?
A: Um plano abrangente de recuperação de desastres inclui a identificação dos sistemas críticos, soluções de backup de dados, arranjos para local de recuperação, RPO e RTO claros, bem como procedimentos detalhados de recuperação.
Conclusão
HA trata-se de prevenir a interrupção em uma configuração local, enquanto DR refere-se à recuperação de um desastre após este ocorrer, potencialmente em uma localização geográfica diferente. Ambos são cruciais para garantir operações comerciais contínuas, mas são implementados de forma diferente com base na tolerância ao risco, nos requisitos do negócio e nos recursos disponíveis de uma organização.
Compartilhar em: