Minería de datos (Data Mining) y su importancia en la IA

DataMining

También conocido como Knowledge Discovery in Databases (KDD) extrae información de un complejo de datos y los transforma en una estructura de información que sea útil para que pueda ser utilizado en otro momento.

Esta extracción de información apoya en gran medida a la IA (Inteligencia Artificial) para detectar patrones de comportamiento a través de algoritmos matemáticos. En pocas palabras, este concepto surge para ayudar a comprender el contenido de una base de datos robusta.

Las etapas por la que se lleva a cabo el proceso de minería de datos son:

-Determinación de los objetivos: se refiere a los objetivos que el cliente desea bajo la orientación del especialista en minería de datos.

-Preprocesamiento de los datos: es la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Es el tratamiento de los datos de manera general.

-Determinación del modelo: es la primera presentación gráfica de la información que se obtuvo del procesamiento de los datos. Estos algoritmos se crean con apoyo de la IA.

-Análisis de los resultados: se enfoca en verificar si los resultados obtenidos son coherentes y los compara con los obtenidos por los análisis estadísticos y de visualización gráfica.

Algunas de las técnicas más utilizadas son:

-Market Basket Analysis: permite detectar qué productos se adquieren conjuntamente, permite incorporar variables técnicas que ayudan en la interpretación, como el día de la semana, localización, forma de pago. También puede aplicarse en contextos diferentes como lo es el e-comercio.

-Series temporales: permite modelizar componentes básicos de la serie, tendencia, ciclo y estacionalidad y así poder hacer predicciones para el futuro, tales como cifra de ventas, previsión de consumo de un producto o servicio, etc.

-Previsión local: individuos parecidos tendrán comportamientos similares respecto de una cierta variable de respuesta. La técnica consiste en situar los individuos en un espacio determinado y hacer predicciones de su comportamiento a partir del comportamiento observado en sus vecinos.

-Redes neuronales: Inspiradas en el modelo biológico, son generalizaciones de modelos estadísticos clásicos. Su novedad radica en el aprendizaje secuencial, el hecho de utilizar transformaciones de las variables originales para presentar nuevos datos y predicciones sobre un comportamiento específico.

-Los árboles de decisión: es un modelo de predicción que se utiliza en el campo de la inteligencia artificial a partir de una base de datos en donde se construyen los diagramas de construcciones lógicas. Normalmente está determinado por una serie de condicionales que definirán la probabilidad de obtener resultados esperados.

Se puede observar claramente la importancia de las técnicas de minería de datos para resolver problemas empresariales. También es clara su aportación para resolver problemas científicos que impliquen el tratamiento de grandes cantidades de datos.

Además, existe una aportación propia de técnicas específicas de inteligencia artificial en particular sobre la integración de los algoritmos, la automatización del proceso y la optimización del costo que implica el resultado del procesamiento de millones de datos en todo momento.

Ir arriba