Datos no estructurados

¿Qué es?

Los datos no estructurados generalmente son datos binarios que no tienen estructura interna identificable, además estos datos cubren el 80% de toda la información que podemos tener en las bases de datos.

Es un conjunto masivo desorganizado de objetos que no tienen valor relevante hasta que se clasifican y almacenan de forma organizada.

Tipos:

  • Correo electrónico
  • PDF
  • Imágenes
  • Video
  • Audio
  • Publicaciones de redes sociales

Características:

  • Origen de la información: redes sociales, email, pdf, etc.
  • Seguridad: la mayoría suele ser de carácter confidencial
  • Terminología: complicado de descifrar por idioma y culturas existentes

 Clasificación

    • Generados por máquinas: Imágenes satelitales, datos del tiempo, datos/estadísticas meteorológicos, datos sísmicos atmosféricos.
  • Generados por humanos: Información interna de empresas, cualquier información textual (email, gráficos, formularios, etc.). publicaciones de redes sociales, datos de geolocalización (GPS de dispositivos móviles).

¿Cómo tratarlos para sacar valor de esta información?

Crear una plataforma escalable que permite tratar grandes cantidades de datos mediante procesos y sistemas de gestión de bases de datos relacionales, aunado a tecnología de big data para el análisis de toda esta información y así convertirla en nuevos datos que nos brindan estadísticas para una mejora continua y generación de valor a nuestro alrededor.

Scroll al inicio