Uncategorized

¿Cuál es la diferencia entre Big Data y Data Science?

Big Data, como tendencia, si nos fijamos, probablemente es un poco inevitable en el mundo en el que vivimos. En una época en la que todas las grandes y pequeñas corporaciones acumulan datos de forma masiva de un modo u otro, era simple cuestión de tiempo que estas mismas corporaciones comenzaran a intuir que, del análisis de esas grandes cantidades de información, podía extraerse contenido de valor.

No importa realmente si a ese conjunto de técnicas los llamamos Big Data o los llamamos por cualquier otro nombre, al final no es más que un término que representa un concepto. Y el concepto es lo que importa. Y, en este caso, el concepto consiste en aportar una serie de técnicas que nos permiten, primero, homogeneizar los datos, y segundo, empezar a realizar operaciones con ellos para, tercero, obtener resultados y previsiones a partir de los mismos.

Data Science, o la Ciencia de los Datos, no es más que la evolución lógica de Big Data. Si Big Data trata acerca de, precisamente, el tratamiento de datos masivos, la ciencia de los datos estudia, de una forma mucho más general, cómo tratar cantidades de datos para obtener información de valor de los mismos. Parece lo mismo, pero no lo es.

Por ejemplo, si tomamos como inicio Big Data, encontramos que trata, en primer lugar, de la recopilación de datos de forma masiva, para su posterior análisis. Y, en muchas ocasiones, para realizar este análisis de datos, requerimos técnicas como, por ejemplo, la inteligencia artificial. De esta forma, la IA no forma una parte intrínseca de Big Data, pero ambas disciplinas guardan una estrecha relación.

Otro segundo ejemplo que podamos tomar, es que cuando trabajamos con grandes cantidades de datos, generalmente nos es necesario contar con algún tipo de método para representar gráficamente la información que queremos comunicar. Sin embargo, la parte de comunicación, analítica y generación de gráficas de múltiples tipos, realmente no forma parte de las técnicas de Big Data, aunque finalmente tenemos que contar con alguna forma de representar nuestros datos de cara a nuestros clientes.

El término de Data Science se establece precisamente como un subconjunto superior con respecto a la concreción de Big Data, se establece como un concepto mucho más genérico, amplio y elevado, cuya misión es tratar los datos desde múltiples perspectivas, con el objetivo de ofrecer una perspectiva completa y global de lo que es el tratamiento, en cualquier forma y en cualquier estrato, de conjuntos de datos. De esta forma, podríamos decir que Big Data es un subconjunto de todo aquello que se trabaja en Data Science.

Poco a poco, el mundo va transicionando desde Big Data hasta Data Science. Los países, a medida que implementan técnicas de Big Data y, una vez implementadas, requieren profundizar más en estos conceptos, van tomando consciencia de la importancia del concepto de Data Science como conjunto más amplio que Big Data.

Una demostración fácil de este concepto la podemos obtener si realizamos una sencilla investigación en Google Trends. Si visualizamos los datos correspondientes a la comparación entre los dos términos, en un país que consideramos tecnológicamente más avanzado que España, encontramos lo siguiente:

Hace ya tiempo que Data Science ha sobrepasado a Big Data en cuanto a términos de búsqueda en internet.

Si analizamos esta misma tendencia en un país como por ejemplo Alemania:

Podemos ver claramente como Alemania se encuentra en la misma situación que USA, pero con un retraso de un año aproximadamente. Los mismos datos representados para Francia nos muestran:

Y es que Francia se encuentra en una situación parecida a Alemania. Por último, si realizamos la búsqueda en España, encontramos lo siguiente:

Y es que nos encontramos, tecnológicamente, en un punto anterior al que podemos encontrar en países que llevan más años implementando este tipo de técnicas. De esta forma, podemos predecir fácil e inevitablemente cual va a ser el futuro de este tipo de técnicas en nuestro país.

Poco a poco, iremos transicionando desde un escenario donde usamos técnicas concretas y locales como aquellas que nos ofrece el Big Data, para implementar una concepción de cómo tratar los datos mucho mas global, una perspectiva mucho más amplia, que nos permita llegar a conclusiones de más valor, y que nos permita obtener el máximo de nuestros datos.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *