Los datos se consideran, y así debe ser, la materia prima para realizar distintas actividades como la investigación, la toma de decisiones basadas en estadísticas, la divulgación de información, la colaboración entre proyectos y otras. Por tal motivo si estás manejando datos (independientemente de la cantidad) lo mejor es garantizar una buena gestión de ellos.

Si estás leyendo esto es porque algo te motivó a conocer más sobre la gestión de datos y lo que debes poner en práctica para lograrlo. Comencemos por decir que gestión de datos está relacionada con el manejo de datos durante todo su ciclo de vida, es decir, desde que son recopilados o tomados de otras fuentes, hasta que se culminan las operaciones con ellos y/o son depositados finalmente para que sean utilizados por otros. La gestión de datos comprende una serie de prácticas, procedimientos, procesos y manejo de sistemas informáticos para ejercer control sobre los datos disponibles, ya sea en una organización, para un proyecto de investigación o en cualquier actividad donde la base fundamental sea el tratamiento de datos.

En este post no vamos a conocer en profundidad el amplio tema de la gestión de datos, pero si te daremos algunas sugerencias y recomendaciones para que, si estás ejecutando un proyecto, estas por iniciar alguno o hasta ahora tienes pensado hacerlo, puedas gestionar mejor los datos que se generen en este proceso. Los tips que te mostramos a continuación están basados fundamentalmente en la gestión de datos de investigación, pero pueden ser replicados fácilmente en otras actividades donde el protagonista sean los datos. Comencemos.

1. Selecciona y organiza tus datos

En cualquier proceso de investigación se reúnen diversos conjuntos de datos, los cuales en la mayoría de ocasiones son de dimensiones grandes. El principal objetivo es garantizar que tus datos adopten los principios FAIR (Fáciles de encontrar (findable), accesibles, interoperables y reusables). Inicialmente necesitas organizar los datos por carpetas de acuerdo a cada tema que consideres. Teniendo en cuenta que al final de la investigación te aconsejamos que tengas una carpeta donde se encuentren los datos «crudos», datos procesados y resultados.

Resulta importante que decidas los datos que verdaderamente son necesarios de preservar a largo plazo y qué datos eliminar, para lo cual te sugerimos limpiar tus datos y eligir aquellos que pueden ser útiles. Si en ocasiones necesitas llevar un control sobre todas las operaciones o cambios en tus datos, puedes utilizar herramientas como Git para llevar un control de versiones.

2. Documenta y cita los conjuntos de datos que utilices

Al igual que con cualquier recurso bibliográfico, los conjuntos de datos que utilices en tus proyectos que sean provenientes de terceros, deben ser citados siguiendo los estándares de acuerdo al tema que estés tratando. La citación adecuada de los datos de investigación brinda distintos beneficios, entre ellos: La investigación tiene mayor publicidad, promueves la reutilización de datos y puedes recibir un estímulo por usar y publicar los conjuntos de datos. Asimismo puedes comparar distintas publicaciones que usen el mismo conjunto de datos y sustentar las conclusiones de los investigadores o encontrar diferencias en los resultados.

Un tema realmente importante en el mundo de los datos abiertos, el código abierto, y en fin, en la Ciencia abierta, es el de la documentación de los datos. La tarea de documentar es básicamente generar, preservar y dar acceso a toda la información sobre el contexto de los datos, su contenido y estructura, el proceso de generación o recopilación,la forma como van a ser utilizados (operaciones a ser realizadas), las transformaciones a las que han sido sometidos, entre otras operaciones que garanticen su reutilización e interpretación adecuada, ya sea por parte de las personas que los han creado o por otras personas interesadas en ello. Sugerimos que esta actividad comience junto con la investigación, para que no se obvie información importante.

No se podría hablar de documentar datos sin mencionar a los metadatos. Podemos referirnos a ellos como «datos sobre los datos» y nos permiten describirlos de forma estructurada y normalizada para lo cual existen estándares generales y especializados.

3. Garantiza la seguridad y la reutilización de los datos

Los datos siempre están expuestos a amenazas de seguridad, por ejemplo, acceso y manejo no autorizado, corrupción del conjunto de datos y también su pérdida parcial o total. Las siguientes alternativas podrán ayudarte a proteger tus datos:

  • Contar con un repositorio personal (respaldo) para los datos y el proyecto general, por ejemplo, utilizando unidades en red dentro de la institución, un repositorio institucional (si es el caso) o un repositorio personal (por ejemplo, en GitHub).
  • Guardar los datos en la nube.
  • Nunca olvides el uso de contraseñas robustas, capaces de resistir ataques informáticos.

4. Guarda tus datos en repositorios

Para facilitar el acceso, preservación, reutilización y seguridad de los datos, te recomendamos que los deposites en repositorios creados para esto, o puedes crear tu propio repositorio. Esto no excluye la posibilidad de compartir los datos de tus proyectos de manera informal, por ejemplo, mediante una solicitud de correo electrónico. Sin embargo, esta no es la manera adecuada de hacerlo, ya que existen plataformas que te brindan la posibilidad de que tus datos estén a la disposición de cualquiera, por ejemplo, GitHub. Si usamos estas herramientas hacemos que otros investigadores puedan utilizar nuestros datos, o en otros casos hacer que un proyecto de investigación sea colaborativo.

De la misma manera, puedes depositar tus datos en algunos repositorios que se encuentran disponibles de acuerdo al tema de estudio, para lo cual debes informarte sobre sus políticas y tomar una decisión sobre distintas alternativas que tengas, donde te garanticen los derechos como recolector de datos y la seguridad de los mismos.

Si almacenas los datos de tu proyecto en un repositorio puedes conseguir financiamiento, ya que actualmente crece la cantidad de empresas que tienen esto como un requisito. Asimismo puedes protegerlos y hacer que tu tiempo y recursos invertidos estén de alguna manera «compensados».

5. Forma parte de la promoción en la apertura y licenciamiento de datos

Como se mencionó al inicio, debes garantizar en la medida de lo posible, que tus datos sigan los principios FAIR. Para promover esa apertura existen condiciones referentes a la reutilización de un conjunto de datos, las cuales varían dependiendo del tipo de investigación y de cada caso en particular. Sin embargo, la ciencia abierta (enlace a artículo de ciencia_abierta) promueve el máximo grado posible de apertura de los datos de investigación, esto quiere decir que si tu propósito es «hacer ciencia abierta» necesitas comenzar por asignar licencias abiertas a tus datos, o con la menor cantidad de restricciones posibles.

Las licencias especifican claramente las condiciones bajo las cuales se pueden reutilizar los conjuntos de datos y las operaciones que se pueden realizar con estos, además de las condiciones con respecto a la propiedad intelectual. Existen estándares de licencias para la apertura de los datos las cuales pueden ser usadas libremente.

Ya te hemos dado algunas sugerencias para que manejes mejor los datos de tus proyectos, recuerda que esto puede ser replicado para cualquier tipo de proyecto que estés realizando o tengas pensado ejecutar. Si continuas indagando sobre el tema de la gestión de datos, puedes toparte con algo denominado Plan de Gestión de Datos, el cual es un documento formal donde se plasma toda la información referente a los procesos y tareas a los cuales serán sometidos los datos durante todo su ciclo de vida. En resumen, es un documento que debe tomar en cuenta todos los aspectos que te mencionamos anteriormente.

Esperamos que te haya servido esta información y de ahora en adelante comiences a ponerla en práctica en el manejo de datos de tus proyectos. Cuéntanos en los comentarios si utilizas repositorios de datos abiertos o si has pensado utilizarlo en tus proyectos de investigación.

Referencias

Comunidad global de gestión de datos Gestión de datos de investigación Recomendaciones para la gestión de datos de investigación

Deja una respuesta