Skip to main content
Parece que está usando Internet Explorer 11 o una versión anterior. Este sitio web funciona mejor con navegadores modernos como las últimas versiones de Chrome, Firefox, Safari y Edge. Si continúa con este navegador, es posible que vea resultados inespera

Gestión de datos de investigación: Gestión de Datos de Investigación

Guía sobre la Gestión de datos de la investigación.

Gestión de Datos de Investigación

El propósito de la Gestión de Datos de Investigación (GDI) es cuidar y mantener los datos que se desarrollen durante toda la investigación, por esto es importante realizar las acciones que abarquen todo el ciclo vital del proceso  investigativo, comenzando con la planificación,  ejecución y proyección de la investigación aun cuando esta haya finalizado.

Durante el transcurso de una investigación se recopilarán un sinnúmero de datos de diverso tipo, los cuales pueden generar grandes volúmenes de información, por este motivo es necesario decidir qué datos preservar en el largo plazo y qué datos eliminar, dependiendo del tipo de  investigación y el potencial de los datos, que tengan para ser reutilizados a futuro, así como las necesidades de la investigación, los requerimientos de las instituciones involucradas o los marcos normativos y la factibilidad y viabilidad económica de la preservación en el largo plazo.

Por todo esto es importante establecer ciertos criterios de selección y organización de datos, control de versiones y nombre de archivos.

A continuación explicaremos algunas recomendaciones que entrega la CEPAL en su guía Gestión de Datos de Investigación.

Formatos utilizados en la Gestión de Datos de Investigación

                                                    

Selección de datos de investigación

La importancia de los datos de la investigación está en estrecha relación con el  momento determinando en que serán utilizados los datos, la información que constituyen estos datos y el propósito para el que se utilizarán.

El Digital Curation Center (DCC) ha sugerido una metodología de 5 pasos para que los investigadores puedan decidir qué datos preservar y qué datos eliminar. 

  • Paso 1: Identificar el propósito que los datos cumplirán
  • Paso 2: Identificar los datos que deben preservarse
  • Paso 3: Identificar los datos que podrían preservarse
  • Paso 4: Considerar los costos
  • Paso 5: Completar la evaluación de los datos

Más información en:

https://biblioguias.cepal.org/gestion-de-datos-de-investigacion/seleccion-datos

Organización de los archivos

Los archivos y carpetas de datos de investigación deben etiquetarse y organizarse de manera sistemática para que sean identificables  y accesibles para los usuarios actuales y futuros.

Hay tres criterios principales a considerar con respecto a la denominación y el etiquetado de los archivos de datos de investigación, a saber:

  1. Organización: importante para el acceso y la recuperación futuros, y debe tener en cuenta las restricciones de denominación de archivos del sistema donde se encuentra el archivo
  2. Contexto: esto podría incluir información específica o descriptiva del contenido, independientemente de dónde se almacenan los datos
  3. Coherencia: elija una convención de nomenclatura y asegúrese de que las reglas se sigan sistemáticamente e incluyan siempre la misma información (como la fecha y la hora) en el mismo orden (por ejemplo, AAAAMMDD)

También hay una serie de elementos comunes que se deben tener en cuenta al desarrollar una estrategia de nombres de archivos, que incluye:

  • Número de versión
  • Fecha de creación
  • Nombre del creador.
  • Descripción del contenido
  • Nombre del equipo de investigación / departamento asociado a los datos.
  • Fecha de publicación
  • Número de proyecto

Buenas prácticas:

  • No utilice nombres de archivos genéricos que se puedan confundir con otros cuando se mueven de una ubicación a otra.  Hay que asegurarse que los nombres de los archivos sean independientes de la ubicación y si trabaja en más de un computador, asegúrese de que sus archivos estén sincronizados.
  • Establezca una política para nombrar los  archivos y carpetas de datos de investigación. Etiquételos de forma que estos sean  identificables y accesibles para los usuarios actuales y futuros. Si en el archivo desea incluir el número de proyecto, coloque más de dos dígitos, ej. 001.
  • Los nombres de los archivos deben ser cortos y relevantes, aproximadamente 25 caracteres es una longitud suficiente para capturar suficiente información descriptiva para nombrar un archivo de datos.
  • No utilice caracteres especiales en un nombre de archivo como: & *% $ £] {! @ ya que a menudo se utilizan para tareas específicas en diferentes sistemas operativos.
  • Las formas para registrar la información puede variar, por ejemplo, se puede registrar por fechas, por número de versión, por el nombre del archivo o por el estado de documento, se puede incluir tablas como control de cambios o utilizar softwares especializados para ello. Registrar las versiones y el estado de un archivo, ej. borrador, provisorio, final, interno.
  • Registrar los cambios que se han realizado a un archivo cada vez que se crea una nueva versión.
  • Registrar las relaciones ente ítems, por ejemplo las relaciones entre un código y el archivo de datos sobre el cual se ejecuta; entre datos y su documentación asociada o metadatos, o entre múltiples archivos de datos.
  • Detectar la ubicación de aquellos archivos que se encuentren almacenados en lugares diferentes.
  • Mantener un archivo maestro único en un formato apropiado para evitar problemas de control de versiones que puedan surgir cuando se trabajan en diferentes archivos de forma paralela.

 

Más información en: 

Métodos de almacenamiento y respaldo de datos

Al momento de planificar la investigación es importante considerar de qué forma serán almacenados los datos que se recopilen o generen en una investigación, por esto es fundamental contar con medios de almacenamiento y respaldo de estos datos, los cuales dependerán de las necesidades de los investigadores durante y después de la investigación.

Los medios de almacenamiento a utilizar no son excluyentes entre si y pueden complementarse:

  • Almacenamiento de datos personal o del proyecto, a través de discos internos o externos USB, discos duros o servidores en red dentro de la institución,
  • Repositorio institucional
  • Almacenamiento de datos institucional 
  • Infraestructura de almacenamiento nacional  
  • Almacenamiento de datos en la nube
  • Repositorio disciplinar

Más información en:

https://biblioguias.cepal.org/c.php?g=495473&p=4398069

Ética, privacidad y confidencialidad de los datos

En toda investigación deben existir ciertos requisitos éticos que se apliquen en la recolección y manejo de los datos de investigación, sobre todo cuando la investigación involucra a personas. Estas consideraciones éticas deben  incluir el propósito y la naturaleza de la investigación en sí misma, el consentimiento obtenido o participación voluntaria, la privacidad y confidencialidad de la información recopilada y la evaluación de los datos que deben protegerse durante el análisis y destruirse después de su uso. Toda investigación que involucre a personas debe estar sujeta a una revisión ética, salvo que los datos se hayan obtenido a través de estudios observacionales puros sobre el comportamiento de los participante. En este caso la observación del comportamiento humano ocurrirá en un foro abierto al público en general, sin identificación de los asistentes al foro, no invasivo, no requiere la interacción con los participantes.

Es importante una revisión periódica de las pautas éticas  ya que las normas van cambiando con el tiempo y por el consenso profesional.

Más información en:

https://biblioguias.cepal.org/c.php?g=495473&p=4396793

Derecho de Propiedad Intelectual

Se entiende el Derecho de Propiedad Intelectual (DPI)  como un derecho adquirido sobre cualquier obra creada o inventada con el esfuerzo intelectual de un individuo, los tipos más comunes de DPI incluyen derechos de autor, patentes, marcas, indicaciones geográficas, derechos de diseño industrial, circuitos integrados y diseños gráfico e información confidencial (secretos comerciales).

Para la gestión de datos, el investigador, debe dejar en claro quién tiene la propiedad primaria de los datos, ya que a la hora de la toma de decisiones  deben ser considerados tanto para la gestión y como difusión de los datos,  esto debe declararse al principio de un proyecto, en la planificación de la gestión de datos.

Más información en:

https://biblioguias.cepal.org/c.php?g=495473&p=4961468

Soporte para gestión de proyectos en código abierto