Uncategorized

El lenguaje de programación R y su relación con Big Data

¿Por qué el lenguaje de programación R, que en principio es tan desconocido, tiene tanta repercusión en el mundo del análisis de datos?

Si buscamos una referencia en el índice TIOBE, veremos que, de hecho, el lenguaje de programación R ocupa un puesto más bien lejano de las primeras posiciones, pero sin embargo, tiene una importancia destacada en aplicaciones de análisis de datos. En este artículo vamos a ver por qué esto es así.

Para decirlo claramente: El lenguaje R es fácil, y tiene herramientas optimizadas para analizar grandes cantidades de datos, y presentar la información de una forma sencilla.

Esto es importante desde el punto de vista en el que tenemos que tener en cuenta no solo las capacidades del lenguaje, sino las personas que lo usan. Qué es lo que hace falta para poder empezar a realizar análisis de datos masivos?

Generalmente, para realizar análisis con grandes cantidades de datos hacen falta varios componentes: Un conjunto de contenedores de bases de datos que proporcionen potencia suficiente como para almacenar y servir eficientemente los datos, un lenguaje de programación tal que nos permita versatilidad a la hora de realizar consultas a los datos, un sistema de interfaz de usuario mediante el cual podamos introducir información y recibir feedback, y probablemente una librería de generación de informes y gráficas sencillo…

Todos estos y algunos componentes más hacen que la introduccion a este mundo, la aproximación a realizar este tipo de extracciones de información sea dura para personas o profesionales que no tengan conocimientos previos de programación.

El lenguaje R provee un sistema ya preparado que ofrece al usuario una interfaz gráfica con la que empezar a programar de forma sencilla, una sintaxis clara que hace que programar sea asequible, y un entorno gráfico mediante el cual podemos obtener informes y gráficas de nuestras peticiones de una forma sencilla y clara.

Por tanto, ¿es el lenguaje R más potente, como muchas veces se dice, para realizar análisis extensos de grandes cantidades de datos? No es el más potente en absoluto, sino el más sencillo para empezar, para personas o profesionales sin conocimientos previos de programación. De hecho R tiene bindings para combinar su ejecución con C++, para aquellas aplicaciones que necesiten de un rendimiento mayor

Debemos tener en cuenta que esta ventaja puede convertirse en un obstáculo a medio plazo: El lenguaje R es muy concreto de un entorno de escritorio, y los programas que desarrollamos en el, o los resultados, no son directamente exportables en tiempo real a otras plataformas (si que lo son, pero con trabajo de conversión e integración, luego lo fácil que resulta al principio, puede ser complejo en un segundo término)

Finalmente, es imprescindible usar el lenguaje R para proyectos de Big Data? Si el equipo está compuesto por personal sin experiencia previa, R puede ser un buen candidato para empezar a obtener resultados con poco esfuerzo desde el punto de vista de la programación. Si en el equipo de análisis hay programadores informáticos, probablemente puede ser incluso más eficiente usar otros lenguajes de programación más asentados.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *