Antes de introducirnos al análisis de datos, debemos de entender ciertos conceptos que lo conforman, tal es el caso de datos estructurados y no estructurados.

Los datos no estructurados son aquellos datos que no tienen una organización definida, un ejemplo de esto es colocar la información que nosotros creemos importante en un documento de texto sin alguna estructura definida, sin embargo, siguen siendo datos e información importante, otros ejemplos de datos no estructurados son correos electrónicos, mensajes de texto, las interacciones en las redes sociales, etc.

Los datos estructurados son los datos que ya tienen un diseño o bien una organización específica, un ejemplo puede ser los datos que existen en una hoja de cálculo que puede contener nombre, domicilio, teléfono, etc., todo ya con un orden específico.

Explicado lo anterior, podemos hacernos la pregunta ¿Qué es el análisis de datos?, es un gran volumen de información de diferentes fuentes con diversas estructuras que viaja a una velocidad tan rápida de cambios (nuevos datos que se van generando en el momento).

Actualmente existen varias herramientas como Hadoop que nos ayuda con el procesamiento de toda esta información que estamos recolectando y que nos ayuda a sacar conclusiones precisas y alcanzar nuestros objetivos como negocio. Aquí presentamos las 4 “V” a tener en cuenta para el análisis de datos:

  •         Volumen

Gran cantidad de información difícil de procesar con los medios tradicionales, pero que cada segundo que pasa esta información va creciendo de forma considerable.

  •         Variedad

Los datos son diferentes y vienen de diferentes fuentes, tal es el caso de la información que tenemos en las diferentes redes sociales, la ubicación GPS, entre otras.

  •         Velocidad

La recepción constante en la que está llegando información nueva y al mismo tiempo se encuentra actualizando información que ya se tenía almacenada en los diferentes motores existentes.

  •         Valor

Es saber qué tan oportuna es la información para los objetivos que se buscan en el negocio (mejorar las ventas, ofrecer productos de interés a los clientes, etc.)

Por último el ciclo de vida de los datos:

  •         Ingesta / Captura

Obtener los datos relevantes para el análisis de las diferentes fuentes existentes identificando los patrones de relación de cada uno de ellos para transformarlos en información de utilidad.

  •         Almacenamiento

Se refiere a un entorno de datos compartidos en su forma original guardados en una herramienta como lo puede ser un data warehouse con el propósito de tenerlos como una sola fuente y limpios de aquella información que no le sirve al negocio.

  •         Procesamiento y análisis

Encontrar patrones de manera predeterminada entre los datos (definir qué es lo que estamos buscando y que tiene relevancia).

  •         Exploración y visualización de resultados

Es el resultado de todo el análisis previo y con el cual nosotros podemos generar informes interactivos, soluciones integradas hechas a la medida de cada uno de nuestros clientes y nuevos prospectos.