¿Qué es?

La deduplicación también conocida como “de-dupe”, es una técnica de respaldo especializada que elimina los datos redundantes almacenados en un sistema de almacenamiento, guardando una única copia de los datos y reemplazando las copias redundantes por indicadores que apuntan a esa única copia, este sistema, consigue ahorrar espacio ocupado por las copias de seguridad.

La deduplicación puede mitigar los problemas encontrados comúnmente en las empresas como lo son grandes cantidades de almacenamiento, duplicidad múltiple de información (archivos, sistemas, carpetas, etc.), costos excesivos de energía, entre otras.

Existen 2 tipos diferentes de deduplicación:

-En el origen: En un sistema de backup se comparan los bloques de información que se desean respaldar con los que ya se han respaldado en ocasiones anteriores, ahorrando el envío al sistema destino de bloques duplicados y haciendo que la transferencia de la información sea mínima a su destino final.

-En el destino: Se apoya totalmente en los recursos del sistema del destino; se recibe el dato y se encarga de compararlo con los datos ya almacenados para eliminar bloques duplicados, como los nuevos datos se comparan con todos los datos ya almacenados, el tiempo de deduplicación que se obtiene suele ser mayor que si se realiza la deduplicación en el origen.

¿Cuál es el enfoque?

La deduplicación tiene el potencial de ahorrar a los usuarios finales grandes cantidades de espacio de almacenamiento si se aplica de forma correcta, además de que puede tener radios de reducción en tasas de 20 a 1 dependiendo del tipo de dato al que se esté aplicando, lo que hace que el disco se esté convirtiendo en una alternativa de almacenamiento más atractiva y viable para esta tecnología.

La aplicación de técnicas de detección de factores comunes que reduzcan el volumen de datos, ya sea a nivel del almacenamiento origen o del dispositivo destino; es cuando se detecta la información redundante, se consolidan los datos duplicados eliminando archivos repetidos y reduciendo al mínimo la cantidad de datos. 

La deduplicación en el origen sustituye el software de respaldos utilizado una configuración cliente/servidor, esto disminuye los requerimientos de ancho de banda considerablemente.

La deduplicación en el destino es generalmente utilizada como parte de un repositorio final para respaldos de datos; existe un software que soporta volúmenes de cinta o dispositivos de discos como destino.

¿Cuáles son las ventajas?

  • Seguridad:

Ratios de 20:1 dependiendo el tipo de dato

  • Mejor uso del espacio de almacenamiento:

Menos recursos

Reducción de archivos duplicados

Utilizar los recursos en otras tareas

  • Simplicidad:

Fácil de usar (menos personal haciendo la misma tarea varias veces)

  • Ahorro de tiempo y costos:

Menos consumo de energía

Menos tiempo de respaldo

Menos espacio ocupado en disco