Portal de Congresos de la UNLP, BIREDIAL-ISTEC 2016

Tamaño de la fuente: 
Un modelo de trabajo para agilizar la generación de documentos de texto para su preservación
Paula Salamone Lacunza, Ariel Jorge Lira, Gonzalo Luján Villarreal, Marisa Raquel De Giusti

Última modificación: 2016-09-06

Resumen


Introducción

 

Los repositorios institucionales (RI) tienen la responsabilidad de gestionar, preservar y ofrecer acceso libre a la producción científica. Para ello, el repositorio debe establecer políticas que aseguren la autenticidad de los objetos digitales, que prevengan la pérdida parcial o total de los mismos, y que permitan acceder a su contenido por una comunidad de usuarios designada. Estas políticas deben ser ejecutadas por un conjunto de actividades de preservación que, idealmente, deberán integrarse al conjunto de tareas de administración del repositorio cotidianas, y así estandarizar y asegurar la realización de las tareas de preservación que se hacen sobre los objetos digitales; de lo contrario. Desde luego, también será necesario realizar revisiones periódicas sobre los métodos y circuitos implementados, estudiar la efectividad de las herramientas y formatos en uso, y realizar perfilamientos y análisis de los objetos digitales del repositorio a fin de controlar la eficacia de las tareas de preservación.

Como es de suponerse, las actividades de preservación pueden requerir una importante carga adicional para los administradores del repositorio. Por ejemplo, como se mencionó, será necesaria la incorporación manual o la verificación y corrección, si son incorporados por el software, de un nuevo conjunto de metadatos de preservación que pueden ser descriptivos (soporte, identificadores), estructurales (capítulos, índices, relaciones) y administrativos (formato, versión del software, resolución, compresión). Pero además de los metadatos, las preservación digital implica el análisis de los formatos de los archivos digitales que se ingestan al repositorio, la selección del mejor formato de transformación o migración, la transformación o migración en sí desde el archivo original hacia su correspondiente formato preservable, la verificación de la correcta transformación a fin de comprobar que no se han generado efectos indeseados que impidan la reproducción apropiada del contenido, la validación según las reglas del estándar utilizado y que el archivo resultante cumpla con las normativas requeridas según el formato al cual ha sido migrado, y finalmente su almacenamiento en un medio adecuado. Sin embargo, las actividades de preservación no finalizan aquí: los archivos almacenados deben almacenarse en distintos medios mediante un sistema de copias de seguridad desatendidas, en lo posible geográficamente distribuidas, a fin de asegurar que no se perderán en caso de catástrofes; también deberán realizarse controles periódicos a fin de asegurar su integridad, y es aconsejable una revisión periódica de los formatos para asegurar la mejor selección de los mismos atendiendo los supuestos de la preservación digital. En fin, no basta con establecer un plan de preservación, sino que es necesario ejecutarlo y revisarlo periódicamente.

 

Materiales y metodología

 

En este trabajo se hará énfasis en el conjunto de tareas que realiza la administración del repositorio relativas al análisis, transformación y validación de los objetos digitales a los fines de la preservación. También expondrán algunos casos especiales detectados, en donde la conversión del objeto digital no sigue un camino estándar establecido y que requieren una evaluación individual para determinar su tratamiento. Se mencionarán las pruebas y análisis realizados con un conjunto de herramientas informáticas y utilizando objetos reales del repositorio SEDICI de la UNLP.

 

Resultados parciales y conclusiones

 

Se presentará aquí un modelo de trabajo semi-automático, mediante el cual los administradores delegan el análisis y transformación de estos objetos a un conjunto de herramientas informáticas, las que a su vez brindan un reporte de las tareas realizadas y los resultados obtenidos. Del conjunto de herramientas analizadas, se destacarán aquellas que fueron finalmente seleccionadas para la realización de las actividades de preservación y los motivos de su selección. También se explicará en detalle la metodología de trabajo implementada a fin de agilizar las tareas de la administración del repositorio a la hora de transformar los objetos digitales y disminuir la carga de procesamiento de los equipos informáticos.

El modelo aquí propuesto se ha implementado por el momento en los documentos de texto, para los que se utiliza el formato PDF/A (en alguna de sus variantes) descrito en las normas ISO 19005-1, ISO 19005-2 e ISO 19005-3, pero como se verá, su diseño e implementación permite fácilmente la incorporación de otros tipos de documentos no textuales, como por ejemplo imágenes o archivos de audio.

 


Palabras clave


repositorios institucionales, preservación digital, metadatos de preservación, actividades de preservación

Citas


PREMIS, “PREMIS: Preservation Metadata Maintenance Activity (Library of Congress),” 2016. [Online]. Available: http://www.loc.gov/standards/premis/. [Accessed: 11-Jul-2016].

 

METS, “Metadata Encoding and Transmission Standard (METS) Official Web Site,” 2016. [Online]. Available: http://www.loc.gov/standards/mets/. [Accessed: 11-Jul-2016].

 

MODS, “Metadata Object Description Schema: MODS (Library of Congress),” 2016. [Online]. Available: http://www.loc.gov/standards/mods/. [Accessed: 11-Jul-2016].

 

CCSDS, Reference Model for an Open Archival Information System (OAIS):ISO 14721 . 2002.

 

M. R. De Giusti, A. Sobrado, A. J. Lira, M. M. Vila, and G. L. Villarreal, “SeDiCI (Servicio de Difusión de la Creación Intelectual),” D-Lib Magazine , vol. 14, Sep. 2008.

 

DCMI, “Dublin Core Metadata Element Set, Version 1.1,” 2016. [Online]. Available: http://www.dublincore.org/documents/dces/. [Accessed: 11-Jul-2016].

 

M. R. De Giusti, A. J. Lira, J. Texier, and G. L. Villarreal, “Las actividades y el planeamiento de la preservación en un repositorio institucional,” BIREDIAL 2012.

 

PDF/A-1: ISO 19005-1

PDF/A-2: ISO 19005-2

PDF/A-3: ISO 19005-3

 

W. Kresse, J.M. Pau, “Development of an ISO-standard for the preservation of geospatial data and metadata: ISO 19165,” Photogrammetrie, Fernerkundung, Geoinformation, vol. 2015, Dec. 2015, Pages 449-456.

 

H.M. dos Santos, D. Flores, “Digital preservation policies for archival documents,” Perspectivas em Ciencia da Informacao, vol. 20, Issue 4, Oct-Dec. 2015, Pages 197-217.

 

B. Ogilvie, “Scientific archives in the age of digitization,” ISIS, Volume 107, Issue 1, March 2016, Pages 77-85.


Texto completo: PDF  |  Diapositivas