Uncategorized

Big Data: Qué es y cómo funciona

Big data es uno de esos términos que se están popularizando en los últimos años, que aparecen, de forma cada vez más frecuente, en los medios, pero que muchas veces no acabamos de entender su significado. O, peor todavía, no acabamos de entender su utilidad.

Como usuarios, se nos dice que nuestros datos, y toda nuestra actividad, se almacena y se analiza en servidores remotos para realizar predicciones sobre nuestro comportamiento. Por ejemplo: Todo aquello que compramos en la red es analizado para ofrecernos nuevas sugerencias de compra adaptadas a nuestras necesidades. Esto es algo que todos sabemos, aunque no comprendamos exactamente cómo funciona. Y, como usuarios, es posible que ni siquiera sea necesario que comprendamos cómo funciona, aunque evidentemente nos preocupe.

Pero, como empresarios, oimos que las grandes corporaciones hacen uso de esos datos, y nos sentimos excluidos, ya que estas grandes corporaciones sacan un partido real (económico) del uso de los datos de los usuarios. Quizás en ese punto no nos preocupamos, por que el poder de grandes corporaciones como Google o como Apple nos parece muy lejano con respecto a nuestras posibilidades. Sin embargo, cuando nos llegan noticias de que algunas empresas de nuestro entorno empiezan a aplicar esas mismas técnicas para aumentar sus beneficios, es cuando nos empezamos a preocupar realmente: ¿Y si nos estamos perdiendo algo importante? ¿Y si nuestros competidores nos toman la delantera de forma silenciosa mediante la aplicación de esta tecnología de gestión de datos? ¿Y si para cuando nos demos cuenta de lo que ha ocurrido, ya es demasiado tarde?

¿Qué es el Big Data?

Vivimos en plena era de la información. Cualquier actividad que realizan los usuarios de la red puede ser registrada y almacenada, y no solo por las grandes corporaciones, sino por cualquier pequeña y mediana empresa que provea servicios en internet. Cuando se produce una interacción por parte de muchos usuarios en una pequeña franja de tiempo, la cantidad de datos recogidos por parte de la empresa es, sencillamente, demasiado grande y demasiado compleja para ser analizada mediante técnicas convencionales. El término anglosajón Big Data hace referencia a una serie de técnicas consideradas no convencionales para tratar grandes cantidades de datos, y obtener información útil de ellas.

¿Cómo afecta el Big Data a las empresas?

Si lo queremos, podemos recoger grandes cantidades de datos de toda la actividad de nuestros usuarios, dentro de los sitios web, las intranets, o en definitiva de cualquier servicio online que prestemos a nuestros clientes. Esta información puede ser analizada y, de ella, se pueden extraer conclusiones de importancia para la empresa. La limpieza de la información de partida y su estructuración para ser analizada, son dos de las primeras fases del big data. Pero lo realmente interesante ocurre después:

Mediante el cruzado de datos a través de diferentes técnicas, podemos obtener patrones de comportamiento, y podemos realizar incluso predicciones acerca de cómo se van a comportar nuestros usuarios.

El Big Data va más allá de la analítica web, pero la analítica sería una base, un pilar sobre el cual podemos fundamentar un análisis de grandes datos. Por ejemplo, una aplicación de analítica nos puede decir, sobre una tienda online, los productos más comprados, las horas del día a las que se producen más compras, o los días de la semana en los que los clientes están más activos. O un panel de control nos puede decir qué productos ha comprado cada cliente, no solo en su último pedido, sino en todos los pedidos que ha realizado.

Un análisis de big data va mucho más allá. Independientemente del volumen de datos, pero siempre que la muestra de datos sea suficientemente grande como para ser representativa, realiza un cruce de datos, combinando todas las compras de todos los clientes (siguiendo con el ejemplo de la tienda online) para, no solo analizar lo que se ha comprado, sino prever lo que se va a ser comprado.

Por ejemplo: En una tienda de ropa, si encontramos que la mayoría de los clientes que compran un pantalón y una camisa, a continuación compran unos zapatos, a cualquier cliente que compre, a continuación, un pantalón y una camisa, le ofreceremos comprar unos zapatos. Y, de esta forma, podremos aumentar nuestras ventas, ofreciendo a nuestros clientes el producto que quieren comprar, justo en el momento en el que lo quieren comprar.

Este ejemplo y su resultado, podría ser extraído, con mayor o menor esfuerzo, de los datos de ventas de una tienda online. Es más: cualquier propietario de tienda online podría saber las costumbres globales de sus clientes sólo con prestar un poco de atención a las ventas. Pero si multiplicamos este ejemplo, nos daremos cuenta de que, en cualquier tienda online, no solo se da el caso de que el cliente que compra una camisa (producto A) y un pantalón (producto B) a continuación compra unos zapatos (producto C): Si empezamos a cruzar un catálogo de productos de cientos o de miles de referencias, con una base de datos de clientes de decenas o centenares de miles, con diferentes hábitos de compra según su edad, su género, u otros muchos parámetros, nos daremos cuenta de que no sólo hay una secuencia A->B->C, sino que hay D->E->F, hay G->H->I, y millones de combinaciones más, de forma simultánea.

Y es entonces cuando tenemos una masa de datos tan grande que, pese a que intuimos que dentro de ella podríamos encontrar información de gran valor, finalmente no tenemos los medios o las metodologías para extraer patrones a partir de esa información, adaptar esos patrones a nuestros procesos de venta, y obtener resultados positivos. Para hablar claramente: no solo vender más, sino también vender mejor.

¿Cómo funciona el Big Data?

Una vez que hemos comprendido los beneficios de analizar estas grandes cantidades de datos y extraer información de utilidad de ese análisis, es cuando nos preguntamos: ¿Qué es lo que tengo que hacer para poder acceder a esa información?

A día de hoy, el Big Data es algo tan nuevo y cambiante, que no existe todavía un estándar, ni herramientas a nivel de usuario, para poder extraer información de una forma unificada y predecible. Hoy en día, cada proyecto de Big Data se diseña a medida de las necesidades de cada empresa, teniendo en cuenta dos factores clave: la entrada y la salida. La salida representa las conclusiones a las que se quiere llegar, los patrones que se están buscando (aunque en ocasiones ocurre que los análisis de Big Data proporcionan incluso más información de la que se esperaba obtener). La entrada representa toda aquella información que se está capturando y que, evidentemente, debe contener los parámetros necesarios para poder obtener la salida esperada.

A partir de ahi, entre la entrada y la salida, se aplican una serie de técnicas de análisis matemático y estadístico, que nos permiten obtener los resultados esperados. El problema para concretar esa serie de técnicas es que dependen, en gran medida, de la naturaleza de la información de entrada.

Por ejemplo: Un análisis de Big Data se podría realizar tanto en los hábitos de compra de los clientes de una tienda online (es decir, estaríamos cruzando los datos de clientes, con los datos de productos, con los datos de compras) cuando buscamos predicciones de compras, y por tanto mejorar los resultados económicos de una empresa, como en miles o decenas de miles de imágenes de resonancias magnéticas de pacientes, cuando buscamos predecir la evolución de ciertas enfermedades, y por tanto mejorar la salud de nuestros ciudadanos.

La idea es que el Big Data se puede aplicar con éxito en una cantidad innumerable de campos, proporcionando beneficios de múltiples tipos. Pero, actualmente, ante tal cantidad diferente de tipos de datos de entrada, y ante tal cantidad de tipos de resultado, no existe un conjunto de herramientas estándar, como alguna vez me han preguntado: un «Excel para Big Data» (aunque es probable que en el futuro si que llegue a existir algo así)

El mañana es hoy

Que no existan estas herramientas a nivel de usuario, no quiere decir que no podamos empezar a sacar partido del análisis de Big Data. Mientras que nosotros no lo hagamos, nuestra competencia lo habrá empezado a hacer ya, serán capaces de obtener mejores resultados, de vender de forma más eficiente, y de planificar sus procesos de empresa de forma más productiva, consiguiendo trabajar de forma más inteligente, y, finalmente, siendo más competitivos, obteniendo mayores beneficios.

Es por esto que, cualquier empresa que ya esté capturando un cierto volumen de datos, o que esté en disposición de hacerlo, debería considerar introducir dentro de sus procesos los análisis de Big Data.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *