El data mining resuelve una de las paradojas más importantes a la que se enfrentan las empresas hoy. Las organizaciones cuentan con importantes bases de datos llenas de información valiosa sobre sus clientes, y sin embargo, cuanta más información tienen más difícil resulta analizarla y sacar provecho de la misma.
El proceso de data mining otorga el poder de manejar y cambiar el futuro de su negocio mediante la comprensión del pasado y del futuro, y la obtención de predicciones rigurosas. Mediante éste es posible solucionar todo tipo de problemas de negocio que se relacionen con datos, como por ejemplo, la adquisición de nuevos clientes, retención de aquéllos más valiosos, up-selling, cross-selling, optimización del presupuesto de una campaña de marketing, detección de fraude y scoring de riesgo, entre otros.
Para resolver estos problemas, el data mining utiliza poderosas técnicas analíticas con una clara orientación a la problemática de negocios, que permiten explorar de manera rápida y en profundidad grandes cantidades de datos, extrayendo conclusiones valiosas y utilizables para la toma de decisiones.
Una visión del futuro
A diferencia del reporting u Online Analytical Processing (OLAP) que son importantes para comprender qué sucedió en el pasado, el data mining es un proceso para comprender qué sucederá en el futuro. Por ejemplo, los informes arrojan como resultado el total de ventas de su compañía en el mes pasado. OLAP va un paso más allá e informa las comercialización por producto del mes pasado. El data mining, en tanto, predice quién tiene altas probabilidades de comprar los productos de su compañía el mes siguiente. Estas conclusiones se incorporan a la estrategia de negocio de la organización, determinando, por ejemplo, la realización de ofertas personalizadas a aquellas personas que es probable que adquieran sus productos, alcanzando un aumento en las ventas y una reducción en los costos de marketing.
Un proyecto de data mining utiliza técnicas predictivas y estadísticas para descubrir patrones en los datos almacenados, y predecir acciones futuras. Estos datos pueden obte-nerse de una combinación de varias fuentes, dependiendo de la herramienta que se utilice. Y todo tipo de información, ya sea que se encuentre en bases de datos tran-saccionales, en encuestas realizadas, en documentos de texto o en registros de actividades online, agrega precisión y profundidad a los resultados que se obtendrán.
Primera Fase: Comprensión del negocio
Para obtener mejores resultados de los procesos de Data mining se puede utilizar el Cross-Industry Standard Process for Data Mining (CRISP-DM). Este en un procedimiento creado por expertos de diferentes industrias que provee guías paso a paso, tareas y objetivos para cada etapa del proceso de data mining, y que se puede utilizar sin importar qué herramienta se elija.
El proceso CRISP-DM está compuesto por seis fases. La primera de ellas es la comprensión del negocio. Antes de comenzar el proceso de data mining debe comprender los desafíos del negocio, la situación actual del mismo, los objetivos principales y los criterios de éxito del proyecto.
En esta etapa es importante pensar y definir quiénes recibirán los resultados del proceso, para adecuar el formato del informe final. No es lo mismo que lo reciban especialistas que lo hagan empleados de diferentes niveles de la organización.
Segunda Fase: Comprensión de los datos
La segunda fase es la comprensión de los datos. En primer lugar, reúna todos los datos necesarios para el proyecto y asegúrese de poder integrarlos con su solución de data mining. Es de mucha utilidad generar reportes que describan el formato de los datos, la cantidad de casos y campos y otras características relevantes. Esto le servirá para evaluar la calidad de los mismos y planificar cómo solucionar cualquier problema detectado.
Preparación de los datos y modelización
El tercer paso consiste en preparar y transformar los datos. Primero seleccione los datos que va a utilizar. Tenga en cuenta que la combinación de varios tipos de éstos le da una descripción más completa de sus clientes y su organización. Asegúrese de que su solución de data mining pueda combinar diferentes fuentes de datos, como aquéllos obtenidos de encuestas, de textos o web sites, y que le permita cumplir con los costos y tiempos asignados para el proyecto.
El siguiente paso del proceso de data mining contempla la modeliza-ción. Al elegir una técnica de mo-delización asegúrese de que la misma sea apropiada para el problema que debe resolver, así como también de si existe algún tipo de requerimiento político por parte de la compañía y limitaciones en relación a la experiencia del staff que trabajará en el proyecto o en el tiempo asignado para la realización del mismo.
Antes de construir el modelo es útil poner a prueba las técnicas que piensa utilizar. A la hora de crear su modelo, ejecute la herramienta de modelización sobre los datos que ya ha preparado. Genere un informe sobre los resultados obtenidos y evalúe la precisión esperada y la efectividad lograda.
A evaluar y ejecutar
En la etapa de evaluación debe determinar si los resultados obtenidos por el modelo lo ayudarán a alcanzar sus objetivos de negocio. Este es el momento de definir si el proyecto es lo suficientemente exitoso como para dar el siguiente paso a su ejecución.
La ejecución del proyecto debe comenzar con el planeamiento de la misma. El plan debe contemplar el mantenimiento de los resultados, proyectando qué puede suceder en el futuro que afecte el uso de los resultados del proceso de data mining.
Lo fundamental del plan de ejecución es asegurarse de que las conclusiones obtenidas lleguen a manos de las personas que deben tomar decisiones estratégicas para guiar la compañía hacia el futuro.
Noviembre de 2005