Ir al contenido principal

Gestión de datos de investigación

Selección de datos para su preservación

Durante el curso de la investigación va a  enfrentar en varias ocasiones la necesidad de  seleccionar sus datos de investigación, por este motivo es importante planificar desde el inicio del proyecto la selección de estos datos respecto de los que finalmente se van a preservar y los que se van a eliminar, para ello es recomendable desarrollar un Plan de Gestión de Datos (PGD),  que estipule:  el propósito de sus datos y la documentación necesaria para su posterior uso; las normas éticas y legales a las que va a adherir;  cómo va a cumplir los requisitos exigidos por su institución u organismo de financiamiento;  los fondos disponibles para cubrir costos por almacenamiento y preservación y,  el uso que futuros investigadores le podrían dar a estos datos.

En esta sección de la guía podrá encontrar información sobre: 

1. Evaluación de la selección de datos

2. Selección de datos de investigación

3. Preservación de datos

 

1. Evaluación de la selección de datos

¿Por qué seleccionar y evaluar los datos de su investigación?

Principalmente,  porque es complejo guardar todos los datos de su investigación por temas de costo, tiempo y,  debido a la dificultad de descubrimiento que conlleva trabajar con grandes volúmenes de datos;  además del riesgo de pérdida de información relevante o de datos únicos si no mantiene una gestión adecuada y sistemática de ellos. La  selección puede ser difícil, a continuación destacamos algunos elementos que debería considerar:

  • Conceptos de tasación: tiene relación  con el proceso de selección de los datos para su retención o eliminación. Este proceso debe ser transparente y debe guiarse por la políticas locales y aspectos legales vigentes.
  • Funciones y responsabilidades: las responsabilidades se comparten entre los investigadores, sus organizaciones y/o fuentes de financiamiento. Las organizaciones, fuentes de financiamiento o editores de revistas  pueden proporcionar pautas respecto del tiempo que se deben preservar los datos y también recomendaciones al seleccionar un recurso para la preservación.
  • Política de valoración y selección: debe asegurar una toma de decisiones consistente y responsable, que establezca criterios para evaluar un conjunto de datos o el valor de un recurso, además de determinar por cuánto tiempo se debe conservar un dato o cuándo se puede destruir. Este proceso se ve influenciado por factores específicos de cada disciplina y criterios generales como: relevancia, valor científico histórico, singularidad, potencialidad de redistribución, no replicabilidad, costos y su respectiva documentación (información necesaria para el descubrimiento, acceso y reutilización de los datos).
  • Proceso de evaluación: se debe justificar las decisiones de selección de los datos respecto de los usuarios actuales y futuros, por lo que deben seguir criterios claros, inequívocos y objetivos. Es importante saber que todas las decisiones se deben registrar y conservar de forma permanente. 
  • Retos y oportunidades: la comunidad científica está impulsando una mayor automatización de los flujos de trabajo, esto presenta retos y oportunidades en relación a la administración  y opciones más rentables respecto de la preservación. 

Fuente: Centro de curaduría digital. (s. f.-a). Cómo evaluar y seleccionar datos de investigación para su curación. Recuperado 7 de septiembre de 2020, a partir de  http://www.dcc.ac.uk/resources/how-guides/appraise-select-data

2. Selección de datos de investigación

¿Cómo seleccionar los datos de investigación?

Existen diversas formas de seleccionar sus datos de investigación, el Digital Curation Center (DCC) ha sugerido una metodología de 5 pasos para ayudar a que los investigadores puedan decidir qué datos preservar y qué datos eliminar.

Paso 1: Identifique el propósito que los datos cumplirán 

Considere el propósito o 'caso de reutilización',  puesto que los datos podrían servir más allá del contexto de la investigación en el que fueron creados o recolectados.

Paso 2: Identifique los datos que deben preservarse 

Generalmente, la decisión sobre lo que se  'debe' conservar dependerá de las prioridades del creador de los datos, es decir, del VALOR de los datos según propósito o caso de reutilización;  asegurando a su vez el cumplimiento de políticas institucionales, regulación entorno a los datos, otros aspectos legales o contractuales y,  el adecuado manejo de los datos sensibles (por ejemplo: datos personales).

Paso 3: Identifique los datos que deberían preservarse 

Debe tener en cuenta los posibles propósitos de reutilización que identificó anteriormente. Como regla general, los datos deben conservarse si ya ha identificado un motivo de cumplimiento de preservación, o puede ayudarse respondiendo alguna de estas preguntas sobre la suficiencia (calidad de los datos y su respectiva documentación), el riesgo de demanda y las copias disponibles de los datos, por ejemplo:

  • ¿Son lo suficientemente buenos?

  • ¿Es probable que me demanden?

  • ¿Qué tan difícil es replicarlos?

  • ¿Existe alguna barrera para un uso posterior?

  • ¿Es la única copia?

Paso 4: Considere los costos

Es importante considerar los costos de administración de los datos de la investigación y las posibles limitaciones presupuestarias de su proyecto de investigación.

Paso 5: Complemente la evaluación de los datos

Finalmente, y considerando todos los factores analizados, debe tomar una decisión sobre la retención de los datos para su preservación. Para ello puede ser de ayuda revisar el siguiente formulario.

Fuentes: 

CEPAL. (2018). Selección de datos. En Biblioguías: Gestión de datos de investigación. Recuperado 7 de septiembre de 2020, a partir de   ”https://biblioguias.cepal.org/gestion-de-datos-de-investigacion/seleccion-datos”

DCC. (2014). Five steps to decide what data to keep: a checklist for appraising research data v.1. Edinburgh: Digital Curation Centre. Recuperado 7 de septiembre de 2020, a partir de   ” http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep;

Traducción de: Digital Curation Centre. (s. f.). How to Appraise and Select Research Data for Curation. Disponible en línea: http://www.dcc.ac.uk/resources/how-guides/appraise-select-data, en el marco del Proyecto LEARN financiado por el programa de investigación e innovación Horizon 2020 de la Unión Europea, No. 654139

3. Preservación de los datos

¿Cuáles son sus opciones de preservación?

Existen varias opciones disponibles, a continuación listamos algunos ejemplos:

  • Repositorio UC o externo.
  • Plataformas para compartir datos como: Figshare.com o Zenodo.org
  • Editores de revistas, los datos como material complementario a un artículo de investigación.
  • Plataformas de gestión de datos,  establecidas por su grupo de investigación con el fin de preservar los datos de acuerdo a estándares reconocidos por la comunidad científica, por ejemplo: OSF (Open science Framework).
  • Centro de datos o un archivo de auto-depósito según recomendaciones del agente financiador o su institución.

  Recomendaciones:

Asegúrese de que el recurso final que va a cuidar de los datos de su investigación cumpla con asignar un identificador único y persistente en el tiempo; cuente con los metadatos necesarios para que el conjunto de datos sea encontrable; tenga herramientas de seguimiento para conocer el uso y descarga de los datos; que esté certificado o sea reconocido como un repositorio confiable y , que  cumpla con los requisitos legales de protección de los datos y las licencias necesarias para la reutilización de estos.

 

 

Fuente: DCC. (2014). Five steps to decide what data to keep: a checklist for appraising research data v.1. Edinburgh: Digital Curation Centre. Recuperado 7 de septiembre de 2020, a partir de   ” http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep;