Si eres una persona con deseos de desarrollar proyectos de código abierto que puedan ser compartidos, quieres replicar y /o mejorar proyectos existentes o convertirte en un científico de datos, es muy probable que hayas leído o escuchado sobre el Lenguaje R. En este post daremos un paso breve sobre sus características, las posibilidades de emplearlo en tus proyectos y las oportunidades laborales que tendrás cuando aprendas a utilizarlo.

Antes de conocer sobre R, vamos primero a resaltar la importancia que tiene y ha tenido la Estadística en distintos ámbitos, ya te darás cuenta por qué lo hacemos. Como profesional en cualquier área, habrás estudiado o al menos te mencionaron la palabra estadística. El mundo y las situaciones cotidianas están rodeadas de incertidumbre y la estadística es la disciplina que se encarga de estudiarla. Sin embargo, para implementarla y conocer su gran potencialidad, resulta necesario manejar una herramienta que sea fácil de aprender, que cuente con la aprobación de un gran número de analistas de datos, que esté en constante actualización y que sea demandada en grandes empresas. En efecto, el lenguaje R cumple con estos y otros requerimientos.

R fue desarrollado por los estadísticos Robert Gentlemann y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en 1993. El acrónimo R se deriva de los nombres de sus desarrolladores. Actualmente es un proyecto de software libre para la computación estadística y los gráficos. Es colaborativo, gratuito, de código abierto y se encuentra a cargo del R Development Core Team. Esto quiere decir, que detrás del proyecto existe una comunidad de usuarios y programadores que buscan mejorar y desarrollar nuevas funcionalidades para el lenguaje. R se perfila como un lenguaje para estadísticos, sin embargo cualquier persona interesada puede utilizarlo. Está pensado para que los usuarios implementen funciones estadísticas, desde las más básicas como el cálculo de promedios, la generación de publicaciones con aplicaciones web, la aplicación de técnicas de machine learning, hasta la generación de gráficos interactivos y de alta calidad. Tienes todo lo que necesitas en un mismo lenguaje.

Puedes utilizar R a través de línea de comandos, sin embargo te recomendamos que utilices un Entorno de Desarrollo Integrado (IDE), por ejemplo RStudio (el cual desde octubre del 2022 se convertirá en Posit) que es uno de los más utilizados por su fácil empleo y las amplias funcionalidades que ofrece.

Ahora bien, ya que conoces un poco más sobre R, quizás en este momento te preguntarás:

¿De qué me puede servir aprender este lenguaje?

La respuesta es simple pero extensa, aquí te presentamos algunas razones para que te animes a utilizar R:

  • Si necesitas resumir, visualizar y analizar cualquier cantidad de datos, R es una buena alternativa porque es fácil de aprender. Solo necesitas tener a disposición un computador, tiempo y sed de conocimientos.

  • Cualquier funcionalidad estadística, como el cálculo de medidas descriptivas, la generación de gráficos potentes y de alta calidad (estáticos y dinámicos) pueden ser fácilmente implementados con R. Tienes todo lo que necesitas en un mismo lenguaje.

  • Mediante la generación de Scripts puedes tener almacenado y a disposición inmediata el código y los datos originales (por ejemplo un archivo .csv más el script de R) para resolver un problema en particular. Esto te permite reutilizarlo y también compartirlo haciéndolo reproducible y colaborativo.

  • Los entornos de desarrollo integrado, como Rstudio, facilitan el desarrollo y te permiten manejar el lenguaje de una manera amigable. En una ventana podrás ejecutar el código, en otra se mostrará la salida, también tienes una ventana para ver las variables que has guardado y otra disponible para que guardes tu script, todo en un mismo lugar.

RStudio

  • R te permite obtener resultados detallados y generar reportes profesionales con ayuda de herramientas como Rmarkdown. Con esta funcionalidad puedes exportarlos a formatos como HTML y PDF. Tu jefe, o la persona interesada en tus reportes, quedará impresionado cuando le presentes un informe detallado utilizando R.

  • Como mencionamos antes, es un software de gran demanda en el mundo laboral, y conocerlo puede mejorar tus posibilidades de empleo. Actualmente las empresas buscan analizar sus datos para tomar decisiones informadas y en base a ello, obtener ventajas competitivas. Por tal motivo, si cuentas con algunas habilidades para el procesamiento y análisis de datos, puedes darle valor a tu perfil profesional utilizando R.

  • Si te animas, muy pronto podrás formar parte de los desarrolladores de R incorporando librerías y paquetes para funciones estadísticas.

  • Aunque no tienes que ser un estadístico ni un programador para usar R, te recomendamos que aprendas los aspectos básicos sobre la interpretación de estadísticas y gráficos, y de dónde se derivan; esto te será de gran ayuda a la hora de generar reportes y/o interpretar resultados. Lo más importante es la disposición y el ánimo que tengas, recuerda que R es fácil de aprender.

  • En la web, en libros y tutoriales disponibles en la página oficial de R encontrarás la documentación necesaria para que aprendas a utilizar este lenguaje y conozcas las funciones y paquetes a tu disposición. El acceso a la documentación de R es totalmente gratuita, una de las características más resaltantes del lenguaje.

  • Con R puedes procesar datos de distintos formatos ya que, entre otras cosas, permite leer datos de diferentes software como SPSS, SAS o Excel.

  • El sistema operativo de tu computador tampoco es un inconveniente a la hora de trabajar con R, ya que es compatible con Windows, Linux y MacOS.

  • Como R es de código y acceso abierto, permite hacer control de versiones usando una herramienta como Git, entre otras.

  • Actualmente se encuentran disponibles más de 2300 bibliotecas desarrolladas en R y puedes descargarlas a través del Comprehensive R Archive Network (CRAN). ¡Imagina todo lo que puedes hacer para procesar tus datos con estas bibliotecas!.

En el post Gigantes informáticos dan su apoyo al lenguaje de programación R indican que Microsoft, Google, HP y Oracle se han sumado al consorcio R porque apoyan el desarrollo de este lenguaje. Si esto es así, debe ser porque tiene altas potencialidades ¿qué opinas?

De la misma manera, grandes e influyentes empresas reconocen sus capacidades, entre ellas NASA, Banco Santander, Samsung, Western Union, eBay, Honda, Hyundai, Avon, Nestle, entre otros según lo mencionado en este post.

Quizás también te preguntarás ¿tiene inconvenientes?

Pues si, aunque R es potente en el ámbito estadístico y de ciencia de datos, no es un lenguaje de programación de propósito general. Los lenguajes de propósito general, como su nombre lo indica, pueden ser utilizados con distintos fines, entre ellos la comunicación entre computadoras y dispositivos, el acceso y manejo de bases de datos, el diseño de imágenes o páginas, la creación de sistemas operativos, compiladores, entre otras cosas y, como ya mencionamos, R es utilizado principalmente como un lenguaje estadístico. Asimismo, en algunos casos, puede resultar lento si se compara con otros lenguajes de programación, como Python.

A continuación presentamos dos estudios formales donde se refleja el lugar que ocupa R con respecto a su uso.

  1. La 20ª Encuesta Anual de KDnuggets Software Poll 2019 la cual contó con más de 1.800 participantes, donde Python obtuvo el primer lugar. Sin embargo, R no se queda atrás en esta encuesta y junto con otro lenguaje llamado RapidMiner son usados aproximadamente por el 50% de los participantes.

  2. En el Estudio de popularidad de lenguajes de programación PYPL PopularitY of Programming Language basado en la cantidad de tutoriales que se buscan en google, para este año R ocupa el séptimo lugar.

Quizás estés pensando que no saber programar es una limitante para aprender R. Eso no debería preocuparte, porque hay una cantidad importante de tutoriales que pueden aportarte ideas para comenzar, y también puedes probar con códigos de ejemplo y datos reales que son de acceso abierto. En las referencias te dejamos algunos enlaces de tutoriales de R, libros y algunas Cheatsheets (hojas de referencia).

Algunos libros para que te inicies con R #

Libro R para principiantes

La traducción al español de “An Introduction to R”. Libro "Una Introducción a R"

Hojas de referencia "Cheatsheets" #

Manejo de datos

Rmarkdown

Referencias #

Website de R

R, un lenguaje y entorno de programación para análisis estadístico

QUÉ ES R SOFTWARE

¿PARA QUIÉN ESTÁ PENSADO R SOFTWARE?