Un proyecto de ciencia abierta así como cualquier otro requiere de una evaluación previa para determinar lo que se necesita hacer y cómo debe llevarse a cabo. En el caso de ciencia abierta, debemos tener en cuenta que por su alcance e impacto en la comunidad científica y sociedad en general es vital estudiar las herramientas que se utilizarán ya que de ellas depende la obtención de resultados óptimos, visualmente atractivos y lo suficientemente informátivos.

Antes de continuar recordemos del artículo ¿Qué es la ciencia abierta? que la ciencia abierta es un movimiento, una manera de ver y hacer ciencia, que busca crear una cultura donde la información de todo el proceso de investigación científica, ya sean los datos, protocolos, cuadernos de laboratorio, resultados obtenidos en las diferentes etapas de este proceso, sean gratuitos y de libre acceso. De esta manera, todas las personas involucradas en el proceso de investigación, ya sean los propios científicos, instituciones de investigación o financiamiento, y público en general, pueden contribuir y colaborar con el esfuerzo de investigación. Con esto se garantiza que el trabajo científico sea abierto e inclusivo, donde el investigador se de cuenta que poner a libre disposición sus trabajos le garantizan, entre otras cosas, el aumento del impacto y difusión de sus investigaciones.

Allí también se menciona que la ciencia abierta es una forma de producir conocimiento científico promoviendo la comunicación y acceso efectivo del contenido de las investigaciones científicas en todas las áreas (instrumentos de trabajo, resultados intermedios y finales) mediante la digitalización y gracias a las bondades del internet.

Ahora, ¿por qué son importantes las visualizaciones en los proyectos de ciencia abierta? Cuando elaboramos un proyecto bajo esta modalidad por lo general analizamos, describimos y descubrimos información que esta contenida en datos, lo cual se hace aplicando métodos estadísticos u otros similares, que se pueden complementar con una o varias visualizaciones o gráficos que permitirán tanto a los analistas como a los lectores tener una visión más general de lo que las medidas numéricas o palabras describen. Además, una visualización logra presentar resultados estéticamente más atractivos y captar la atención en puntos en los que más enfoque requieran.

Para tener esto último un poco más claro, utilicemos un ejemplo. Supongamos que estamos estudiando las enfermedades en un periodo de tiempo dado, en una región específica, y tenemos la información que corresponde a la edad, sexo y la enfermedad que presentan los pacientes atendidos en los centros hospitalarios de ese período.

Entonces podemos considerar la estadística descriptiva como una de las técnicas ideales en este caso, se calcularían estadísticos como la media para la edad, la proporción para el sexo y el tipo de enfermedad. A su vez podemos hacer cruces de información a través de tablas de contingencia y a partir de estas elaborar gráficos que complementarán esta información. Estos gráficos lograrán de forma sintetizada mostrar lo que los datos revelan, resultará más fácil hacer comparaciones además, los colores y las áreas de las figuras trazadas captarán la atención de lo que requiere tener cuidado para la toma de decisiones. Todo ello es una clara y simple noción de lo que una visualización puede ayudar.

A continuación veamos cinco bibliotecas o librerías de Python que nos permiten hacer visualizaciones.

  • Matplotlib: es una de las primeras y más populares bibliotecas de visualización de Python. En su página web podemos encontrar una corta descripción de ella; se indica que Matplotlib es una biblioteca muy completa para crear visualizaciones estáticas, animadas e interactivas en Python. Con esta biblioteca se pueden generar gráficos de barras, histogramas, espectros de potencia, stemplots, scatterplots, gráficos de error, gráficos circulares y muchos otros.

    Es uno de los métodos más simples para las representaciones básicas, está diseñada con la filosofía de que deberías crear un gráfico simple con pocas líneas de código, o simplemente una. Además, se complementa muy bien con otras bibliotecas de análisis de datos, tal es el caso de Pandas.

    Si estás utilizando la distribución Anaconda de python, no es necesario intalar esta biblioteca porque ya viene por defecto. En el caso de poseer otra distribución De Phyton, la puedes instalar con pip utilizando las siguientes líneas de código:

    python -m pip install -U pip python -m pip install -U matplotlib

  • Seaborn: es una biblioteca de visualización basada en Matplotlib, permite hacer gráficos estadísticos visualmente atractivos, posee estilos predeterminados y paletas de colores que están diseñados para obtener resultados más estéticos y modernos. Podemos obtener gráficos de barras, histogramas, circulares, gráficos de error y muchos otros.

    Para instalarlo puedes hacerlo a través de pip utilizando:

    pip install seaborn

    O si estas utilizando la distribución Anaconda:

    conda install seaborn

    Podemos encontrar más información de esta biblioteca en su página web.

  • Bokeh: Es una biblioteca de visualización que permite crear tanto gráficos sencillos como gráficos especializados, dashboards y orientados a la web. Los resultados de las visualizaciones constan de elegancia y son estéticamente atractivos, los gráficos son muy versátiles.

Si eres un usuario de Anaconda puedes utilizar la siguiente línea de código para instalarla

conda install bokeh

En el caso de que utilices otra distribución de Python la puedes instalar con pip mediante:

pip install bokeh

Es posible consultar más información acerca de esta biblioteca en su página web.

  • Plotly: Es una herramienta de visualización que permite hacer gráficos interactivos con calidad de publicación. Entre estos gráficos están algunos como lineales, de dispersión, de área, de barras, de error, de cajas, histogramas, mapas térmicos, subgráficos, de múltiples ejes, polares y de burbujas. Esta biblioteca de Python es gratuita y de codigo abierto, su código fuente se puede ver en GitHub.

    Plotly puede ser instalada utilizando pip:

    pip install plotly==4.6.0

    o conda:

    conda install -c plotly plotly=4.6.0

    Para consultar más sobre esta biblioteca puedes hacerlo en su página web.

  • ggplot: es una implementación de ggplot2 de R, esta biblioteca permite elaborar una gran cantidad de gráficos estadísticos que son estéticamente atractivos. Tiene una relación simbiótica con la biblioteca pandas y su misión es crear gráficos en menos tiempo y así tener más tiempo para interpretarlos.

    Se puede instalar a través de pip:

    pip install ggplot

    Puedes consultar más sobre ggplot en su página web.

Todas estas bibliotecas son de código abierto y cuentan con un soporte en la web, existen foros y varios canales de información sobre ellas. No son las únicas que puedes incluir en tu proyecto, hay muchas opciones más, te invitamos a que explores y pruebes estas herramientas.

Deja una respuesta