BigData, tecnología para estimular una nueva realidad

Alberto Sotomayor, consultor TI de Ibermática, introduce el Big Data como una nueva vuelta de tuerca para la irrupción de las plataformas digitales.

Publicado el 10 Jun 2015

Alberto Sotomayor, Consultor TI de Ibermática

Existe una importante diferencia entre lo que decimos que hacemos y lo que realmente hacemos. Por ejemplo, si preguntas al público sobre qué tipos de programas ve en la televisión, pocas personas te dirán que ven Gran Hermano. Sin embargo, los datos registrados por los audímetros dicen todo lo contrario y la gran cantidad de comentarios en redes sociales referentes a este evento no hacen más que corroborarlo. El éxito de este tipo de programas es indiscutible, porque así nos lo hace ver el comportamiento de los televidentes registrado en forma de datos.

Hasta ahora, pocas situaciones, negocios y actividades de nuestra vida diaria han podido ser analizadas con un rigor similar al que otorgan los datos de audiencias al negocio televisivo. Y sin datos que nos permitan tener una visión objetiva de las cosas recurrimos en primera instancia a nuestra experiencia y a nuestra intuición para poder comprender lo que ocurre y prepararnos para lo que nos depara el futuro.

El problema es que generalmente asumimos, como verdaderos, patrones que tienen una baja precisión. Esto es debido a que nuestra mente tiende a simplificar las cosas y a generalizar a partir de casos cercanos y de gran impacto emocional, obviando, de forma interesada o por omisión, otras variables que pueden ser influyentes.

Una alternativa más directa para acercarse a esa realidad es la de salir a preguntar con encuestas o sondeos, especialmente cuando el universo que queremos analizar escapa a nuestro control. Pero ya sabemos, como dice el refrán, que “del dicho al hecho hay mucho trecho”.

Precisamente sobre estos problemas viene a aportarnos soluciones el BigData. Con dos capacidades principales:

  • La de recoger, procesar y almacenar de forma eficiente, y en ocasiones en tiempo real, grandes volúmenes de información granular, reflejando con todo lujo de detalles lo que está ocurriendo en una determinada realidad, aunque sea de forma caótica y poco estructurada.
  • La de extraer conocimiento-valor a partir de esa gran masa de información, ayudándonos a comprender lo que está ocurriendo en esa realidad que estamos analizando y predecir cómo se comportará en el futuro.

El BigData ofrece los medios necesarios para recoger todos los hechos de una realidad y después ofrece mecanismos que ayudan a entender por qué esa realidad es así. Pero todo esto no podría funcionar si no fuera alimentado por grandes “torrentes” de datos que ofrecen ese detalle sobre lo que ocurre.

No se puede entender el auge del BigData sin su confluencia con la creciente digitalización de la sociedad en todos los ámbitos y sectores, materializada a través de la proliferación de dispositivos móviles, wearables que recogen toda nuestra actividad física diaria; la sensórica que ofrece datos sobre el comportamiento de todo tipo de máquinas, robots y equipos en los proceso industriales; el Internet de las Cosas que aglutina información de nuestros comportamientos en ciudades, vehículos y hogares; los drones que captan imágenes sobre la situación de infraestructuras; los smartmeters que miden los consumos eléctricos; etcétera.

La ventaja de sacar valor de la marabunta de datos

Si analizamos el BigData desde un punto de vista de innovación tecnológica, el aspecto diferencial que introduce se encuentra más bien en la primera de las capacidades, la de recoger, procesar y almacenar grandes cantidades de información de forma eficiente y en tiempo. Las nuevas tecnologías de computación “en memoria” y las nuevas plataformas de procesamiento masivo de información de forma distribuida, como Hadoop o Spark, son los máximos exponentes de estas innovaciones.

Pero de poco sirve una innovación tecnológica si no se tienen unos “para qué”-s claros que, en definitiva, se traduzcan en ventajas competitivas para las empresas o en beneficios claros para la ciudadanía. El BigData aflora su valía precisamente a través de la segunda de las capacidades, la de poder extraer conocimiento-valor de esa gran masa de información. Aunque en este ámbito las técnicas que se utilizan fueron inventadas hace ya algún tiempo: provienen del data mining, como la correlación, la clusterización, la regresión, el machine learning, sistemas expertos, etcétera, que han revivido una segunda juventud con el BigData.

Estos “para qué”s pueden clasificarse según cuatro grandes bloques y son aplicables en todos los sectores:

  • Búsqueda sobre información en bruto: búsqueda semántica vectorial para análisis de sentimiento en textos, object mining para encontrar patrones en fotografías, vídeos, etcétera.
  • Comprensión de la realidad actual: microsegmentaciones de clientes en función de múltiples variables de comportamiento (no solamente variables de perfil), correlaciones y relaciones causa-efecto, detección de casos anómalos.
  • Predicción, planificación y simulación de escenarios futuros: predicción de incidencias en el tráfico, impacto de diversas variables en la demanda de solicitudes en un centro de atención a usuarios, simulaciones de escenarios en plantas de fabricación, análisis de impacto de inversiones en nuevas infraestructuras, etcétera.
  • Estimulación de una nueva realidad: venta cruzada y recomendaciones de servicios-productos, personalizaciones de oferta y publicidad, pricing dinámico, etcétera.

Por tanto, la disponibilidad de los datos a niveles granulares y la tecnología son parte fundamental de la ecuación del BigData, pero no son suficientes. Por sí solos poco pueden hacer sin alguien que sepa reconocer comportamientos y patrones interesantes (y coherentes) dentro de esos datos. El análisis de los datos es complejo. Las máquinas y los algoritmos no pueden hacer todo el trabajo, requieren de un componente humano, el data scientist, mitad experto en datos mitad experto en el negocio, que descarte el ruido y aporte una cierta interpretación.

En definitiva, si quieres saber más sobre cómo se comportan y qué factores inciden y guían a tus procesos, tus clientes o a tu mercado en general, no te quedes exclusivamente en lo que dicen las encuestas o lo que dice tu intuición y experiencia. Este tipo de análisis pueden esconder subjetividades o ser demasiado simples. Mejor hazte con datos granulares, con la tecnología necesaria y con los servicios de un data scientist que te ayude a extraer lo que hay detrás de esos datos.

¿Qué te ha parecido este artículo?

La tua opinione è importante per noi!

C
Redacción Computing

Artículos relacionados

Artículo 1 de 3