-
Principes et effets de la technologie de déduplication de données
-
Fonctionnalité de déduplication dans Windows Server
-
Cas d'utilisation de la fonctionnalité de déduplication de Windows Server
-
Méthodes de mise en œuvre de la déduplication Windows Server
-
Solution complète de protection Windows Server
-
Foire aux questions sur la déduplication de sauvegarde Windows Server
-
Conclusion
À mesure que la quantité de données des entreprises continue de s'accroître, le problème des données redondantes sur les dispositifs de stockage est devenu de plus en plus sérieux. Windows Server, en tant que système d'exploitation largement utilisé dans les environnements d'entreprise, propose diverses fonctionnalités de gestion du stockage, dont l'une est la technologie de déduplication. Cet article expliquera en détail la technologie de déduplication dans Windows Server, notamment ses principes, ses effets et ses méthodes de mise en œuvre, dans le but d'aider les lecteurs à mieux comprendre et appliquer cette technologie afin d'améliorer l'efficacité du stockage et réduire les coûts de stockage pour les entreprises.
Principes et effets de la technologie de déduplication de données
La déduplication de données n'est pas une technologie propre à Windows Server, mais une technologie largement utilisée dans le domaine du stockage. Dès la fin des années 1980 et le début des années 1990, l'industrie du stockage a commencé à explorer des moyens d'éliminer les données redondantes afin d'améliorer l'efficacité du stockage, en particulier dans les environnements professionnels. Avec l'augmentation du volume des données d'entreprise, les dispositifs de stockage rencontraient des problèmes de gaspillage d'espace, notamment pour les fichiers de sauvegarde, les fichiers d'images de machines virtuelles et les grandes quantités de contenu dupliqué présent dans les systèmes de contrôle de version.
La technologie de déduplication des données a pour objectif de rechercher et d'éliminer les données en double dans les périphériques de stockage, libérant ainsi un espace de stockage précieux. La technologie de déduplication dans Windows Server repose principalement sur deux principes : la comparaison par hachage et la comparaison octet par octet.
1. Comparaison de hachage
La comparaison de hachage est une méthode rapide pour déterminer si des fichiers sont des doublons. Elle effectue un calcul de hachage sur le contenu des fichiers, générant un identifiant unique appelé valeur de hachage. Si deux fichiers ont la même valeur de hachage, cela indique que leurs contenus sont identiques, et l'un des fichiers peut être supprimé en toute sécurité. L'avantage de la comparaison par hachage réside dans sa rapidité, car elle doit uniquement calculer la valeur de hachage une seule fois, plutôt que de comparer l'intégralité du contenu des fichiers.
2. Comparaison d'octets
La comparaison par octets compare directement les flux d'octets de deux fichiers. Si les flux d'octets sont exactement identiques, leurs contenus sont en double et peuvent être supprimés. Bien que la comparaison par octets soit précise, elle prend plus de temps que la comparaison par hachage, en particulier lorsqu'il s'agit de gros fichiers.
En utilisant ces deux principes, la technologie de déduplication des serveurs Windows peut améliorer considérablement l'utilisation de l'espace de stockage. La suppression des données en double réduit non seulement les coûts de stockage, mais améliore également la vitesse de sauvegarde et de récupération, puisque ces processus impliquent moins de données.
Fonctionnalité de déduplication dans Windows Server
L'origine de la fonctionnalité de déduplication des données dans Windows Server remonte aux premières exigences et évolutions technologiques en matière de stockage.Présentée comme une fonctionnalité standard dans Windows Server 2012, cette technologie optimise l'efficacité du stockage en éliminant les données redondantes.Cette fonctionnalité est principalement utilisée pour réduire l'utilisation de l'espace de stockage, en particulier lorsqu'elle traite de grands volumes de données similaires, notamment dans les environnements de serveurs de fichiers, de stockage de sauvegarde et de machines virtuelles.Les principes fondamentaux impliquent divers algorithmes et technologies, qui sont principalement divisés en composants essentiels tels que la segmentation des blocs de données, la comparaison des hachages, les tables de référence de stockage et les mécanismes de gestion de la déduplication.Grâce à l'optimisation continue des algorithmes et des performances de déduplication, Microsoft l'a développé en un puissant outil d'optimisation du stockage qui offre une solution plus efficace et rentable pour le stockage de données à grande échelle.
Cas d'utilisation de la fonctionnalité de déduplication de Windows Server
La fonctionnalité de déduplication des données de Windows Server offre des avantages considérables, notamment dans les environnements de serveur de fichiers et de stockage de sauvegarde. Par exemple :
Serveurs de fichiers : En utilisant la déduplication, Windows Server peut réduire la consommation d'espace de stockage. Par exemple, les documents partagés, les modèles ou plusieurs versions de fichiers peuvent être stockés sous forme d'une seule copie, les autres versions faisant référence aux blocs de données originaux pour économiser l'espace de stockage.
Environnements de sauvegarde : La déduplication peut réduire considérablement les besoins en espace de stockage pour les sauvegardes, en particulier entre les sauvegardes incrémentielles. Elle peut stocker une seule fois uniquement les parties identiques des données de sauvegarde, réduisant ainsi fortement l'utilisation du stockage et améliorant l'efficacité des sauvegardes.
Environnements de virtualisation : En éliminant les duplications des fichiers VHD/VHDX, les besoins de stockage pour les images de machines virtuelles peuvent être réduits, en particulier lorsque plusieurs machines virtuelles utilisent le même système d'exploitation, permettant à plusieurs machines virtuelles de partager une image de base commune au lieu de stocker une copie complète du système d'exploitation pour chaque machine virtuelle.
Microsoft Exchange Server : La déduplication des données peut réduire le stockage des données en double dans les pièces jointes et le corps des emails, économisant ainsi de l'espace disque. Cela est particulièrement important pour le stockage à long terme et l'archivage des emails.
Méthodes de mise en œuvre de la déduplication Windows Server
Configuration GUI de la déduplication
1. Dans le Gestionnaire de serveur, ajoutez le rôle de déduplication.
2. Accédez à Server Manager > File and Storage Services > Volumes.
3. Cliquez avec le bouton droit sur le volume pour effectuer la déduplication, puis cliquez sur Deduplicate.
4. Choisissez le mode de données de déduplication : Default pour les serveurs de fichiers généraux, Hyper-V pour les serveurs d'infrastructure de bureau virtuel (VDI), Backup pour les serveurs de sauvegarde virtualisés.
5. Configurez la planification de la déduplication, activez l'optimisation du débit et sélectionnez les jours, l'heure de début et la durée. (Les paramètres par défaut seront appliqués, généralement exécutés pendant les week-ends ou les périodes d'inactivité).
Dédupliquez les fichiers plus anciens qu'un nombre spécifié de jours (par défaut 3 jours), qui peut être modifié à 0 jour pour dédupliquer tous les fichiers.
Note : Les fichiers qui n'ont pas été modifiés depuis plus de 3 jours seront dédupliqués.
6. Une fois la configuration terminée, vous pouvez consulter les économies d'espace disque dans "Server Manager > File and Storage Services > Volumes". (Il est recommandé de vérifier après une semaine pour les fichiers avec plus de données).
Commande PowerShell pour activer la déduplication
Enable-DedupVolume -Volume <Volume-Path> -UsageType <Selected-Usage-Type>
Où «<Volume-Path>» est le volume (c'est-à-dire la lettre du lecteur) à activer, et «<Type-d'utilisation>» peut être l'une des trois options suivantes : Default pour les serveurs de fichiers, Hyper-V pour les serveurs d'infrastructure de bureau virtuel (VDI), et Backup pour les serveurs de sauvegarde virtualisés.
Commande PowerShell pour exécuter la déduplication avec des ressources maximales :
Start-DedupJob -Type Optimization -Volume <Your-Volume-Here> -Memory 100 -Cores 100 -Priority High
Supprimer et rétablir la déduplication
La déduplication peut réduire l'utilisation du disque, mais si elle n'est pas utilisée correctement, elle peut augmenter les entrées/sorties (IO). De plus, cette fonctionnalité divise le disque en segments, ce qui peut rendre la défragmentation difficile lorsque l'utilisation du disque est élevée. Par conséquent, il peut parfois être nécessaire de désactiver la déduplication et d'annuler l'optimisation. Cela peut être réalisé en suivant les étapes suivantes :
1. Ouvrez PowerShell en mode administrateur.
2. Exécutez la commande pour vérifier l'état de la déduplication :
Get-DedupStatus -Volume D:
3. Désactiver la déduplication :
Disable-DedupVolume -Volume D:
4. Si nécessaire, annulez l'optimisation du dédoublonnage :
Start-DedupJob -Volume D: -Type Unoptimization
5. Vérifiez le statut d'exécution de la tâche :
Get-DedupJob
6. Redémarrez l'ordinateur pour terminer le processus.
Remarque : Ce processus peut être long, utilisez-le avec précaution !
Lors de la réalisation de la déduplication des données sur Windows Server, les points suivants doivent être pris en compte :
Assurez-vous qu'une sauvegarde complète est effectuée afin d'éviter toute perte de données en cas de suppression accidentelle.
La déduplication est une opération très intensive en termes de calcul, il est donc préférable de choisir un moment approprié pour l'exécuter afin d'éviter d'impacter les activités commerciales.
Le seuil de dédoublonnage peut être réglé pour réduire le risque de suppressions accidentelles. Les administrateurs doivent ajuster ce seuil en fonction des conditions réelles afin d'obtenir les meilleurs résultats.
Solution complète de protection Windows Server
Vinchin Backup & Recovery prend en charge de manière complète différentes versions de Windows Server, notamment 2003/2003 R2, 2008/2008 R2, 2012/2012 R2 ainsi que 2016, 2019, 2022. Grâce à des fonctionnalités telles que la planification par lots et les sauvegardes automatisées complètes, incrémentielles et différentielles, il simplifie la protection des charges critiques Windows. La protection continue des données (CDP) au niveau des volumes de Vinchin garantit une réplication en temps réel, un RPO et un RTO quasi nuls, ainsi qu'un basculement automatisé, offrant ainsi de solides capacités de reprise après sinistre. De plus, Vinchin prend en charge les sauvegardes sans agent pour Hyper-V sur les serveurs Windows, permettant d'intégrer facilement les machines virtuelles au système de sauvegarde, sans nécessiter d'agent dans chaque système d'exploitation invité.
Vinchin renforce également la sécurité grâce à la protection contre les logiciels rançonneurs et permet la récupération instantanée des serveurs physiques et des machines virtuelles, minimisant les temps d'arrêt en montant directement les données de sauvegarde pour une restauration rapide. Ces fonctionnalités en font une solution fiable pour protéger les charges de travail des entreprises sur Windows Server.
Pour sauvegarder le serveur avec Vinchin, il suffit de suivre les étapes ci-dessous :
1. Sélectionnez le serveur sur l'hôte
2. Sélectionnez ensuite la destination de sauvegarde
3.Configurer les stratégies de sauvegarde
4. Soumettre enfin le travail
Essayez dès maintenant la version d'essai gratuite de 60 jours avec toutes les fonctionnalités de Vinchin Backup & Recovery. Ou, vous pouvez contacter Vinchin directement pour plus d'informations.
Foire aux questions sur la déduplication de sauvegarde Windows Server
1. Quelle quantité de stockage peut être économisée en utilisant la déduplication ?
Les économies de stockage varient en fonction du type de données sauvegardées. Dans certains cas, la déduplication peut réduire les besoins de stockage de 30 % à 80 %, selon le niveau de redondance des données.
2. Puis-je utiliser la déduplication dans des environnements virtualisés avec Hyper-V ou VMware ?
Oui, le dédoublonnage peut être utilisé dans les environnements virtualisés pour réduire le stockage nécessaire aux sauvegardes des machines virtuelles. Par exemple, vous pouvez stocker des fichiers de disque virtuel Hyper-V ou VMware (VHD, VMDK) sur un volume avec le dédoublonnage activé. De plus, lorsque vous sauvegardez ces machines virtuelles avec Vinchin Backup & Recovery, la fonctionnalité de dédoublonnage qu'il propose peut vous aider à économiser une quantité significative de stockage.
Conclusion
La technologie de déduplication de Windows Server offre une solution puissante pour optimiser l'efficacité du stockage dans les environnements d'entreprise. En éliminant les données redondantes grâce à des méthodes de comparaison de hachage et d'octets, elle réduit les coûts de stockage, améliore les performances des sauvegardes et augmente l'efficacité globale du système. Grâce à son intégration transparente dans les serveurs de fichiers, les environnements de sauvegarde et les infrastructures virtualisées, la mise en œuvre de la déduplication peut significativement simplifier la gestion des données, offrant ainsi une méthode économique pour répondre aux exigences croissantes du stockage moderne en entreprise.
Partager sur: