-
¿Qué es la alta disponibilidad?
-
Tipos de alta disponibilidad
-
¿Qué es la recuperación ante desastres?
-
Alta disponibilidad frente a recuperación ante desastres
-
Mejore la protección de datos con la solución Vinchin
-
Alta disponibilidad frente a recuperación ante desastres Preguntas frecuentes
-
Conclusión
La alta disponibilidad (HA) y la recuperación ante desastres (DR) son dos componentes críticos de la gestión de sistemas informáticos que tienen como objetivo garantizar el funcionamiento continuo y el tiempo de inactividad mínimo para los servicios. Aunque a veces se utilizan indistintamente, se refieren a estrategias y soluciones diferentes.
¿Qué es la alta disponibilidad?
La alta disponibilidad se refiere a la capacidad de continuar accediendo a una aplicación en caso de fallo de un solo componente del sistema local, independientemente de que el fallo esté en los procesos empresariales, las instalaciones físicas o el software/hardware de TI. El mejor escenario de disponibilidad es cuando una de sus máquinas deja de funcionar, y los usuarios que utilizan su servicio no perciben ningún impacto en absoluto.
Cuando su máquina deja de funcionar, los servicios que se ejecutan en esa máquina definitivamente necesitarán realizar una conmutación por error. El costo de la conmutación por error se mide en dos dimensiones: RTO (Recovery Time Objective) y RPO (Recovery Point Objective).
RTO es el tiempo que tarda un servicio en recuperarse, siendo el mejor escenario 0, lo que significa que el servicio se restaura inmediatamente; el peor caso es infinito, lo que significa que el servicio nunca se recupera. RPO es la cantidad de datos que se pierden durante la conmutación; 0 significa usar datos sincronizados, mayor que 0 significa que hay pérdida de datos. Por ejemplo, "RPO = 1 día" significa usar datos del día anterior para la recuperación, por lo tanto, cualquier dato dentro de ese día se pierde. Por lo tanto, el resultado óptimo de recuperación es RTO = RPO = 0, pero esto es demasiado idealista, o el costo para lograrlo es demasiado alto.
Para HA, se suele utilizar almacenamiento compartido, lo que permite un RPO = 0. Al mismo tiempo, a menudo se emplea un modo HA Activo/Activo para lograr un RTO casi igual a 0. Si se usa un modo HA Activo/Passive, entonces es necesario minimizar el RTO.
Tipos de alta disponibilidad
La alta disponibilidad requiere el uso de servidores redundantes para formar un clúster que ejecute la carga de trabajo, incluidas aplicaciones y servicios. Esta redundancia también permite dividir la alta disponibilidad en dos categorías:
HA activo/pasivo: En esta configuración, los servicios se ofrecen solo en el nodo activo. Cuando el nodo activo falla, el servicio en el nodo pasivo se inicia para reemplazar al servicio proporcionado por el nodo activo.
HA Activo/Activo: En esta configuración, el sistema ejecuta la misma carga de trabajo en todos los servidores dentro del clúster. Tomando una base de datos como ejemplo, las actualizaciones de una instancia se sincronizan en todas las instancias. Esta configuración suele utilizar software de equilibrio de carga para proporcionar una IP virtual para los servicios.
HA categoriza los servicios en dos tipos:
Servicios con estado: Las solicitudes subsiguientes al servicio dependen de las solicitudes anteriores.
Servicios sin estado: Las solicitudes al servicio son independientes entre sí y completamente autónomas.
¿Qué es la recuperación ante desastres?
Un desastre se refiere a un evento repentino que ocurre debido a causas humanas o naturales, provocando un mal funcionamiento grave o una parálisis de los sistemas informáticos dentro de un centro de datos. Esto interrumpe las funciones empresariales apoyadas por los sistemas informáticos o reduce los niveles de servicio a un estado inaceptable durante un período determinado, lo que generalmente requiere cambiar a un sitio alternativo para continuar las operaciones.
Recuperación ante desastres es la capacidad de restaurar datos, aplicaciones o capacidades empresariales en un centro de datos de una ubicación diferente cuando un desastre afecta al centro de producción.
La tolerancia a desastres se refiere al sitio redundante que los usuarios establecen además del sitio de producción. Cuando ocurre un desastre y el sitio de producción resulta dañado, el sitio redundante puede asumir las operaciones normales del negocio para garantizar la continuidad del mismo. Para lograr una disponibilidad aún mayor, muchos usuarios llegan incluso a establecer múltiples sitios redundantes.
Existen dos métricas principales para medir un sistema de recuperación ante desastres: RPO y RTO. RPO representa la cantidad de pérdida de datos que es aceptable cuando ocurre un desastre, mientras que RTO representa el tiempo que tarda el sistema en recuperarse. Cuanto más pequeños sean los valores de RPO y RTO, mayor será la disponibilidad del sistema. Naturalmente, esto requerirá una mayor inversión por parte del usuario.
Alta disponibilidad frente a recuperación ante desastres
La relación entre HA y DR está interconectada y es complementaria, aunque presentan diferencias significativas:
HA generalmente se refiere a un sistema local de alta disponibilidad que garantiza que las aplicaciones sigan funcionando sin interrupciones en múltiples servidores en caso de fallo de cualquiera de ellos. Las aplicaciones y sistemas deben poder conmutar rápidamente a otros servidores para continuar las operaciones, lo cual implica el uso de clústeres de sistemas locales y conmutación automática en caliente. HA utiliza comúnmente almacenamiento compartido, por lo que normalmente no hay pérdida de datos (RPO = 0), y se centra principalmente en el RTO.
DR se refiere a un sistema de alta disponibilidad que está geográficamente distribuido (ya sea dentro de la misma ciudad o en una ubicación diferente) y denota la capacidad de recuperar datos, aplicaciones y operaciones empresariales en caso de un desastre mediante la replicación de datos. Dependiendo de la tecnología de replicación utilizada (sincrónica, asincrónica, clúster extendido, etc.), suele haber cierta pérdida de datos, lo que resulta en un RPO > 0. Además, el traslado de aplicaciones a un sitio remoto generalmente lleva más tiempo, por lo tanto, el RTO > 0. Por esta razón, es necesario personalizar los valores de RTO y RPO requeridos según las necesidades específicas del negocio para lograr el costo total de propiedad (CTO) óptimo. Un sistema remoto de recuperación ante desastres suele incluir un clúster local de alta disponibilidad (HA) y un centro de datos DR remoto.
Las diferencias entre los dos también se pueden ver desde otras perspectivas:
Desde la perspectiva de las fallas, HA se encarga principalmente de la falla de componentes individuales que provocan la transferencia de cargas entre servidores dentro de un clúster, mientras que DR está diseñado para abordar fallas a gran escala que requieren la transferencia de cargas entre centros de datos.
Desde la perspectiva de la red, las tareas dentro de la escala de una LAN son el dominio de HA, mientras que las tareas a escala de una WAN entran en el ámbito de DR.
Desde la perspectiva de la computación en la nube, HA es un mecanismo dentro de un mismo entorno en la nube para garantizar la continuidad del negocio, mientras que DR es un mecanismo entre múltiples entornos en la nube para garantizar la continuidad del negocio.
Mejore la protección de datos con la solución Vinchin
Vinchin Backup & Recovery es una solución profesional diseñada para brindar protección de datos y recuperación ante desastres en entornos virtualizados. Admite diversas plataformas virtuales como VMware, Hyper-V, XenServer, Proxmox, XCP-ng, etc., y bases de datos, NAS, servidores de archivos, Linux & Windows Server, entre otros. Diseñado específicamente para entornos virtualizados, Vinchin ofrece copias de seguridad automatizadas, copias de seguridad sin agentes, opciones LAN/LAN-Free, copiado remoto, recuperación instantánea, deduplicación de datos y archivado en la nube. Cuenta además con cifrado de datos y protección contra el ransomware.
Con la función de copia de seguridad sin agente, permite la rápida integración de máquinas virtuales en el sistema de copia de seguridad. Ofrece características de recuperación ante desastres tales como Restablecimiento Instantáneo para reiniciar máquinas virtuales desde copias de seguridad en segundos, copia remota para almacenamiento de copias de seguridad en ubicaciones externas, y verificación automática de copias de seguridad para comprobaciones de integridad. Además, facilita la migración de máquinas virtuales entre diferentes hipervisores para transiciones sin interrupciones entre entornos virtuales.
Solo se necesitan 4 pasos para hacer una copia de seguridad de su máquina virtual con Vinchin Backup & Recovery:
1. Seleccione el objeto de copia de seguridad.
2. Seleccione la ubicación de copia de seguridad.
3. Seleccione estrategias de copia de seguridad.
4.Revise y envíe el trabajo.
Descubra por sí mismo el poder de este sistema integral con ¡una prueba gratuita de 60 días! Deje sus necesidades específicas, y obtendrá una solución personalizada que se adapta perfectamente a su entorno informático.
Alta disponibilidad frente a recuperación ante desastres Preguntas frecuentes
1. P: ¿Cuál es la diferencia entre alta disponibilidad y tolerancia a fallos?
A: Si bien ambos buscan garantizar la operación continua, la alta disponibilidad implica un breve tiempo de recuperación tras un fallo, mientras que la tolerancia a fallos está diseñada para proporcionar servicio ininterrumpido incluso durante un fallo, sin tiempo de inactividad.
2. P: ¿Es la alta disponibilidad lo mismo que el equilibrio de carga?
A: No, pero el equilibrio de carga es un componente de la Alta Disponibilidad. Distribuye las cargas de trabajo a través de múltiples recursos informáticos, ayudando a garantizar que ningún servidor individual se convierta en un punto de fallo.
3. P: ¿Cuáles son los componentes clave de un Plan de Recuperación ante Desastres?
A: Un plan integral de recuperación ante desastres incluye la identificación de sistemas críticos, soluciones de copia de seguridad de datos, acuerdos para un sitio de recuperación, definición clara de los objetivos de punto de recuperación (RPO) y tiempo de recuperación (RTO), así como procedimientos detallados de recuperación.
Conclusión
La alta disponibilidad (HA) se trata de prevenir tiempos de inactividad dentro de una configuración local, mientras que la recuperación ante desastres (DR) se enfoca en recuperarse de un desastre una vez ocurrido, potencialmente en una ubicación geográfica diferente. Ambas son cruciales para garantizar la continuidad operativa del negocio, pero se implementan de manera diferente según la tolerancia al riesgo, los requisitos del negocio y los recursos disponibles de una organización.
Compartir en: