De sobra es de todos conocido el popular refrán que a la letra dice “Perro viejo no aprende nuevos trucos”. Sin duda, este dicho se refiere al inexorable paso del tiempo y como éste afecta nuestra capacidad intelectual, y nuestro deseo de explorar nuevos paradigmas. Si ya hemos probado un camino y lo conocemos a profundidad ¿por qué no recorrerlo tantas veces como sea necesario?
Pero este popular dicho, no solo se aplica al efecto del tiempo sobre el ser humano, también puede aplicarse al efecto de los procesos internos de cualquier negocio. Así, tenemos negocios que navegan sobre aguas conocidas pero con barcazas a punto de hundirse.
México se encuentra rezagado en materia informática, pero los negocios empiezan a descubrir y usar herramientas de software, que si bien no son nuevas, últimamente están adquiriendo el impulso como una instrumento estratégico útil que además de mantener a flote la barcaza, también ayude a convertirla en una embarcación capaz de navegar no solo en aguas conocidas sino también en las inexploradas.
La minería de datos, aunque no es una panacea, si es una técnica que proporciona información útil para redefinir o encausar los objetivos globales de un negocio. A lo largo del mundo varias organizaciones desean innovar y están usando la minería de datos para localizar y satisfacer clientes de gran valor, reconfigurar su oferta de productos, y minimizar errores.
La minería de datos es un proceso que usa varias herramientas de análisis de datos para descubrir patrones y relaciones en los datos, que pueden ser usados para realizar predicciones válidas.
Los pasos para realizar este proceso son:
- Describir los datos
- Construir un modelo predictivo
- Verificar el modelo
Es importante comprender que la minería de datos es una herramienta y no una varita mágica. No elimina la necesidad de conocer el negocio y los datos, al igual que en el ejemplo de la barcaza, se le pueden proveer los mejores mapas de navegación pero si no sabe las capacidades de la embarcación es improbable que pueda navegar tranquilamente. Por lo tanto, la minería de datos es un asistente para el análisis de datos, sus relaciones y el descubrimiento de patrones.
Minería de datos y OLAP
Una de las preguntas más comunes en el procesamiento de datos es la diferencia entre OLAP y minería de datos. Podemos adelantar que son dos herramientas diferentes que se complementan.
OLAP es parte de una gama de herramientas de toma de decisiones. Las consultas tradicionales y los reportes describen lo que hay en la base de datos. OLAP va más allá, es usado para responder porque ciertas cosas son ciertas. Un analista genera una serie de patrones y relaciones hipotéticas usando consultas(queries) para aprobarlos o rechazarlos. OLAP es en esencia un proceso deductivo.
Pero, ¿qué pasa cuando el número de variables por analizar es por docenas o incluso cientos? Se vuelve más difícil el encontrar una buena hipótesis, analizar la base de datos con OLAP, verificarla o desaprobarla.
La minería de datos es diferente de OLAP porque en lugar de verificar patrones hipotéticos, usa los mismos datos para descubrir tales patrones. Es en esencia un proceso inductivo.
Minería de datos exitosa.
Hay dos llaves para tener éxito con la minería de datos. La primera es llegar a un modelo preciso del problema que se está tratando de resolver. Posteriormente analizaremos conceptos como Clustering y Análisis de Relaciones. La segunda es interpretar y usar los datos. Conoceremos varios algoritmos como las Redes Neuronales, Árboles De Decisión, Inducción De Reglas, K-Vecino Cercano, Regresión Logística, Análisis de Discriminantes y Algoritmos Genéticos.
Referencias.Introduction To Data Mining And Knowledge Discovery. 3rd. Edition. Two Crows Corporation.An Introduction To Data Mining. Kurt Thearling
Que tal Cecilia.
Los algoritmos genéticos no se usan en la minería de datos propiamente; son algoritmos que se usan para “enseñarles” a las redes neuronales como realizar una predicción. Son llamados algoritmos genéticos porque siguen los patrones de la evolución biológica, en la cual ciertas caracteristicas son heredadas de una generación a otra.
En estos días publicare la segunda parte sobre las Herramientas del Modelo, y ahi vienen incluidos los algoritmos genéticos.
Gracias por visitarnos. Te esperamos con mayor frecuencia.
SALUDOS.
ESTOY HACIENDO UNA HERRAMIENTA DE ANALISIS DE INFORMACION, Y QUIERO APLICAR MINERIA DE DATOS, PERO QUIERO QUE LA MINERIA DE DATOS TRABAJE DIRECTAMENTE CON LA BASE DE DATOS SIN QUE EXISTA UN DATA WAREHOUSE, PORFAVOR, TAMBIEN DESEARIA SABER COMO ES QUE TENGO QUE INGRESARLE PARAMETROS PARA QUE LA HERRAMIENTA HAGA UNA BUSQUEDA, ES DECIR, TENGO CLARO QUE ES LO QUE HACE LA MD PERO NUNCA HE VISTO UN SISTEMA, ES POR ESO QUE QUIEOR UNA ARQUITECTURA FUNCIONAL DONDE PUEADA VER QUE HAY QUE INGRESAR Y COMO ES QUE SE VEN LOS RESULTADOS.
Según entiendo estas haciendo una herramienta desde cero con algoritmos que tu vas a programar para hacer análisis de información.
Considerando eso, te comento que actualmente existen herramientas que ya implementan algoritmos de minería de datos, algunas de ellas tienen su propio lenguaje de consulta, por ejemplo Analysis Services de Microsoft utiliza DMX.
Por favor indica más detalle técnico de lo que estas haciendo para recomendarte alternativas viables.
necesito elaborar una tablita sencilla que compare clementine, SAS, WEKA, entre otros, ¿habrá una comparativa en la WEB?
que tal necesito relizar un ejemplo de una base de datos de una unidad academica los conceptos los tengo pero el como hacer predicciones no lo se peor en donde buscar un ejemplo concreto de que pasos debo seguir por favor les agradeceria su ayuda… gracias
Hola soy michael no se como hacer un data mining sencillo soy nuevo y busco ayuda. help me please. gracias
Muy buenos dias, estoy buscando como hacer una Data Warehouse deuna bodega de datos.
Si pueden me ayudan a obtener conocimientos.