¿Qué es un lago de datos?

Ladodedatos

La transformación digital sin duda sigue avanzando rápidamente, de tal forma que nuestro entorno es más del 50% digital, es decir, dependemos de medios digitales para realizar la mayor parte de nuestras actividades como es, comunicarnos, estudiar, laborar, transacciones financieras, viajar, compras, etc.

Debido a la digitalización, se generan muchísimos datos que deben ser almacenados en diferentes repositorios para que posteriormente sean consultados y analizados, sin embargo, hay diferentes tipos de datos en diferentes formas, como son:

  • Dato estructurado. Se organiza de forma relacional en un archivo, por ejemplo: en una base de datos relacional, los datos se organizan por filas y columnas dentro de una tabla.
  • Dato semi-estructurado. No tienen una forma relacionada formal entre sí, pero tiene un patrón y una estructura que permite su análisis, por ejemplo: hojas de cálculo y archivos XML.
  • Dato quasi-estructurado. Consta de datos textuales sin relación entre ellos y su formato puede estar dado por un software y por el tiempo en que se creó, por ejemplo: clics en una página web, páginas visitadas, tiempo que permaneció en la página cuando ingresó y cuando salió un usuario.
  • Dato no estructurado. No tienen una estructura definida y se almacenan en diferentes tipos de archivos. por ejemplo: documentos de texto, PDFs, archivos multimedia.

Lagodedatos

Un Lago de Datos o Data Lake, es un repositorio o almacenamiento empresarial de datos en su forma nativa como fueron creados (estructurados, semi-estructurados, quasi-estructurados y no estructurados). 

La arquitectura escalable de un Lago de Datos nos permite almacenar grandes volúmenes de datos en sus diferentes variaciones y con diferentes velocidades; una ventaja es que los datos pueden almacenarse y ser consultados en tiempo real mediante herramientas de Big Data, estas herramientas nos permiten acceder, gestionar, gobernar y realizar búsquedas en tiempo real de la información contenida en los datos.

La información es consultada y analizada por herramientas de análisis de datos para obtener estadísticas que ayuden a las empresas a tomar decisiones de manera más ágil, precisa e inteligente basadas en datos.

Por lo tanto, si bien se sabe que los datos es el activo fijo más valioso que tienen ahora las empresas, es importante e indispensable comenzar a planear la construcción de un Lago de Datos, en donde se podrá almacenar toda esa información que el negocio genera, obtenerla de las diferentes fuentes y sacarle el mayor provecho.

Scroll al inicio