Cuando hablamos de un proyecto de Big Data, nos referimos a proyectos intensivos en datos, preferiblemente con fuentes de información masivas y diversas donde los datos se obtienen en cualquier formato y de los cuales, a través de analítica avanzada, obtenemos información clave para la toma de decisiones de forma rápida y eficaz.
La piedra angular de cualquier proyecto de Big Data es un driver de negocio que tenga que ver con lograr impactos en la cuenta de resultados incrementando ingresos o reduciendo costes. Por tanto, es necesario definir un objetivo, y el Big Data debe ser una palanca para su logro. Además, debe quedar claro cuánto estamos dispuestos a invertir en función del retorno definiendo el presupuesto, los plazos de desarrollo y la finalización.
Organización y gobierno del dato
Un tema importante es determinar quién es el sponsor del proyecto y quién lo lidera, detallando responsabilidades y comunicando internamente las características del proyecto y la función y el equipo que lo va a poner en funcionamiento. Debe quedar claro el equilibrio jerárquico-funcional, así como la participación de las áreas de negocio y tecnología.
En este punto es imprescindible definir el modelo de gobierno del dato, los procesos de negocio involucrados, así como acordar y unificar los conceptos de negocio que se van a tratar. La mayoría de los proyectos que fracasan lo hacen porque no se pregunta al usuario final del dato qué es lo que espera, qué necesidades tiene, cuáles son los indicadores importantes para la toma de decisiones y la periodicidad para recibir la información, así como su granularidad y grado de interrelación con otros datos.
El siguiente paso es realizar un análisis de situación de partida desde el plano de los datos existentes y de los que se pueden necesitar. Debemos disponer de fuentes estables, donde los datos se emitan con una periodicidad. El dato debe ser consistente y con integridad estadística. Además, es importante la automatización a la hora de generarlo, es decir, huir de procesos manuales que generen cuellos de botella, retrasos y problemas de calidad.
En caso de no disponer de fuentes suficientes, es necesario analizar la incorporación de fuentes externas, bien open data, redes sociales o bases de datos privadas que pueden adquirirse. A continuación, hay que definir las reglas de negocio que van a hacer transformar el dato, así como las diferentes integraciones, asociaciones y derivaciones que puede sufrir hasta que sea puesto a disposición del usuario como indicador clave o KPI.
Elegir la tecnología
Evaluar las capacidades tecnológicas de la empresa y determinar qué se necesita para abordar el proyecto es el siguiente paso. Es posible que haya que evolucionar la tecnología existente o incorporar nueva. Dependiendo del presupuesto y del objetivo, se puede optar por tecnología on premise o cloud. Las soluciones deben adaptarse a los requerimientos del negocio.
Hay que pensar dos veces si es necesario “real time” o vale con “razonable real time”, puesto que los requerimientos de máquina, aprovisionamientos y soluciones de Business Intelligence son infinitamente más caros.
Si el CIO tiene mentalidad tradicional, es probable que opte por aprovechar el legacy instalado. Es más cómodo, pero también más costoso a la larga y puede sentar rigideces en la arquitectura tecnológica. Por el contrario, si está dispuesto a innovar, debería plantearse arquitecturas disruptivas que integren el sistema informacional en el transaccional, y apostar por el datawarehouse distribuido para democratizar el Business Intelligence en la organización.
En todo caso, y para evitar un naufragio, si no tiene las capacidades internas, es mejor delegar en un experto. Actualmente, el 60% de las iniciativas de Big Data en las grandes organizaciones son un fracaso y no por culpa de la tecnología sino por haberse saltado alguno de estos pasos.