28 Sep Le Dédoublonnage de ses données offre quels avantages ?
Dédupliquer des datas signifie procéder à l’élimination des datas en doublon dans une ou plusieurs bases de données.Cette méthodologie est employée pour effectuer la sauvegarde des datas avant leur transfert sur un réseau.
En quoi la déduplication des données peut-elle être utile ?
Dédupliquer des données permet le stockage d’un modèle parfaitement cohérent de datas dans une base de données ou dans un SI (système d’information) global. Dédupliquer des datas permet aussi leur examen puis leur comparaison, entre datas récemment collectées et datas déjà en stock. Si des datas sont déjà présentes, les algorithmes utilisés pour dédupliquer élimineront les nouvelles datas et les remplaceront par un pointeur.
Par exemple, vous procédez à la sauvegarde d’un fichier déjà existant, le fichier précédent et les modifications sont enregistrés dans un segment de données total. Néanmoins, lorsqu’il n’existe aucune différence, on procède à la création d’un pointeur tout en ignorant le nouveau fichier.
Tous ces dispositifs ont un même but : rendre les modes de stockage des bases de données plus performants.
Dédubliquer des datas est une opération qu’emploient le plus souvent les sociétés qui fournissent des espaces de stockage. L’objectif est une exploitation optimisée de ces derniers. Les différentes fonctions de la déduplication font partie d’un tout, que l’on intitule « réduction de données ». Tous ces dispositifs ont un même but : rendre les modes de stockage des bases de données plus performants. Si elles adoptent les techniques de déduplication ad hoc, les organisations pourront procéder au stockage de plus de données que le suggère leur capacité de stockage globale.
Exemple d’utilisation d’une déduplication de datas
Les organisations exécutent souvent un environnement de bureau virtuel, où des centaines de postes de travail identiques sont stockés sur un serveur. Elles gèrent souvent l’exploitation de plusieurs centaines de fichiers et d’autres solutions logicielles dont les utilisateurs peuvent avoir ponctuellement besoin.
Ces dispositifs peuvent aussi ajouter des matériels de protection des bases de données, comme des outils de sauvegarde, des VTL (Virtual Tape Librairies) ou des serveurs de stockage connectés en réseau.
Considérons que les images de chaque poste de travail consomment 25 Go d’espace disque, cela représente donc 5 To de capacité pour 200 postes. Avec la déduplication, il est possible de ne stocker qu’une seule copie de ces machines virtuelles. À chaque fois que l’application découvre une donnée qui est stockée quelque part dans l’environnement de stockage, il enregistre un petit pointeur à la place de la copie de données, ce qui libère ainsi des blocs qui seraient autrement occupés.
Les déduplications fonctionnelles diminuent la charge de traitement afférentes aux solutions logicielles. Ces dispositifs peuvent aussi ajouter des matériels de protection des bases de données, comme des outils de sauvegarde, des VTL (Virtual Tape Librairies) ou des serveurs de stockage connectés en réseau.
Même si les applications permettant de dédupliquer peuvent procéder avec efficacité à l’élimination les redondances de datas à la source, les fonctionnalités matérielles se concentrent surtout sur la réduction des datas lors du stockage. En conséquence, si dédupliquer matériellement ne génère pas de véritables économies de la bande passante, ce fait est largement compensé par l’obtention de vitesses de compression plus rapides.
Dédupliquer matériellement des datas procure des performances élevées, des possibilités d’évolution et un déploiement relativement sans interruption. Cette méthodologie est particulièrement adaptée aux déploiements des grandes entreprises, beaucoup moins à ceux des PME ou à des bureaux distants.