Preservación digital

De Wikipedia, la enciclopedia libre.
Saltar a navegación Saltar a búsqueda

La preservación digital es el conjunto de actividades encaminadas a garantizar la duración en el tiempo y la conservación de la información en formato digital. La preservación digital se define como tal solo cuando es a largo plazo y está a salvo de cualquier error de almacenamiento para cualquier recuperación de la misma información durante todo el período en el que se almacena la información.

Descripción

La preservación digital puede entenderse como el conjunto de procesos y actividades que aseguran el acceso continuo a la información digital, así como a todo tipo de registros y legados científico-culturales en formato digital. Incluye tanto la información que ha sido digitalizada (es decir, que tuvo un origen analógico), como la que se originó en forma digital y sin contraparte analógica. En el lenguaje de las imágenes digitales y los recursos electrónicos, la conservación ya no es solo el producto de un programa, sino un proceso en constante cambio. En este contexto, la información digital se conserva para asegurar su longevidad en el tiempo. La retención a largo plazo de información digital va acompañada de la inclusión de metadatos de retención .

El patrimonio cultural de la sociedad humana se puede conservar en diversas formas materiales como piedra , pergamino , bambú , papel , etc. En esta era, existe una gran cantidad de información en forma digital, como sitios de noticias, blogs, sitios de redes sociales, sitios de preservación de imágenes y sitios que cambian su contenido con el tiempo. Según los datos reportados por Brewster Kahle , fundador de Internet Archive en 1996, en el artículo Preserving the Internet publicado en Scientific American en 1998, la duración promedio de una URL era de 44 días. [1]

La característica única de la información en formato digital hace que su contenido se pueda actualizar fácilmente pero, al mismo tiempo, implica muchas dificultades para su conservación en el tiempo.

El término del almacenamiento informático (literalmente "almacenamiento") en italiano se traduce como archivo o conservación / preservación , según el contexto.

Deterioro fisico

El primer problema que se enfrenta en la preservación de los datos digitales está relacionado con el hecho de que los medios en los que se almacena la información son más vulnerables al deterioro y los desastres naturales. El papel se deteriora en términos de brillo y color, pero este mismo deterioro se hace visible después de al menos diez décadas; y cuando el deterioro ocurre realmente, ocurre solo muchas décadas después. También es posible recuperar toda la información sin ninguna pérdida incluso después de que el deterioro haya mostrado sus efectos. Los datos registrados en forma digital se deterioran en mucho menos tiempo, una vez que ha comenzado el deterioro en muchos casos los datos se pierden irremediablemente. Esta característica de los datos digitales deja muy poco tiempo entre la decisión de mantener los mismos datos y la implementación de la conservación.

Obsolescencia digital

Icono de lupa mgx2.svg El mismo tema en detalle: Obsolescencia digital .

Otro problema, quizás incluso más grave e importante, es el problema del acceso a largo plazo. La tecnología digital se está desarrollando muy rápido y la forma de recuperar información digital puede quedar obsoleta en unos pocos años. Cuando se abandona un software o tecnología para decodificar información digital o el hardware en el que se almacena la información ya no está disponible, la información registrada se puede perder fácilmente simplemente porque ya no es accesible. Este proceso también se conoce como obsolescencia digital .

Este problema se debe a la falta de estándares , protocolos y métodos de preservación digital establecidos [2] : por ejemplo, las copias de datos se han almacenado en cintas en el pasado y los estándares para esta tecnología han cambiado enormemente en los últimos años, por lo que hay no, no hay garantía de que también sean legibles en el futuro [3] .

Estrategias

Existen varias estrategias para almacenar datos digitales a lo largo del tiempo.

Refrescante

Actualizar (actualizar, recargar) [4] es la transferencia de datos entre dos medios digitales del mismo tipo; de esta forma no se producen cambios ni alteraciones en la representación binaria de los datos [5] . Un ejemplo es la transferencia de datos del censo de población de un disco compacto a otro. Esta estrategia debe combinarse con la de migración (ver más abajo ) cuando el software o hardware requerido para leer los datos ya no está disponible o no es adecuado para leer los formatos de datos. La estrategia de renovación puede resultar necesaria en casos de deterioro físico del soporte.

Migración

La migración es la transferencia de datos a un nuevo sistema, o incluso a diferentes medios digitales. Esta estrategia puede implicar la conversión de recursos de un formato a otro (por ejemplo, convertir un documento de Word a PDF o OpenDocument ), de un sistema operativo a otro (por ejemplo, deSolaris a Linux ) o de un lenguaje de programación a otro (por ejemplo, de el lenguaje C a Java ) para que el recurso siga siendo totalmente accesible y funcional. Los datos que han pasado por el proceso de migración corren el riesgo de perder algunos tipos de funcionalidad que los nuevos formatos no pueden trabajar o leer, o puede suceder que el conversor, o programa, utilizado para la conversión no pueda interpretar todas las peculiaridades de el formato original.
La Administración Nacional de Archivos y Registros y Lockheed Martin están desarrollando un sistema de migración de datos que mantendrá intacto cualquier tipo de documento, creado con cualquier aplicación, en cualquier plataforma o con cualquier tipo de medio digital. Con este tipo de sistema, los archivos se transforman en formatos flexibles, como XML ; por lo tanto, serán fácilmente accesibles mediante nuevas tecnologías en el futuro. Lockheed Martin cree que será imposible desarrollar un sistema de emulación para los archivos de la Administración Nacional de Archivos y Registros porque el volumen de datos y el costo serían excesivos.

Duplicación

La duplicación es la creación de una o más copias de datos en múltiples sistemas. Los datos que están disponibles en una sola copia en un solo sistema están sujetos al riesgo de fallas del software que lo ejecuta o del hardware , de alteración intencional o accidental, o de catástrofes ambientales como incendios, inundaciones, etc. A través de la duplicación en múltiples sistemas en diferentes ubicaciones, los datos tienen muchas más posibilidades de permanecer intactos.

Emulación

Icono de lupa mgx2.svg Mismo tema en detalle: Emulador .

La emulación es la duplicación de la funcionalidad de un sistema obsoleto (por ejemplo, la emulación Atari 2600 en un sistema Windows o la emulación WordPerfect 1.0 en un sistema Macintosh ). Se pueden crear emuladores para aplicaciones, sistemas operativos o plataformas de hardware. La emulación ha sido una estrategia popular para dar vida a los videojuegos de plataformas más antiguas, como el proyecto MAME . La flexibilidad de la emulación como sistema universal ha sido debatida por la comunidad académica. Raymond A. Lorie sugirió la creación de una computadora virtual universal que en el futuro podría ejecutar cualquier software en cualquier plataforma aún desconocida o aún no creada. Esta estrategia no fue adoptada masivamente por la comunidad.

Uso de metadatos

Icono de lupa mgx2.svg Mismo tema en detalle: Metadatos .

Los metadatos son datos incrustados en un archivo digital que incluye información sobre: ​​creación, derechos de acceso, restricciones de acceso, historial de retención y derechos de uso [6] . Los metadatos pueden quedar obsoletos. ASCII se considera el formato más duradero para metadatos [7] porque se usa ampliamente, es compatible con versiones anteriores cuando se usa con Unicode y usa caracteres legibles por humanos, no códigos numéricos. Conserva la información a lo largo del tiempo pero no la estructura con la que se representa. Para mayor funcionalidad, también se puede utilizar SGML o XML . Ambos idiomas se almacenan en formato ASCII pero contienen etiquetas que denotan estructura y formato.

Objetos digitales certificados

Los objetos digitales que pueden garantizar su propia autenticidad se denominan "objetos digitales certificados". Se explican por sí mismos: incorporan el historial de todos los cambios en un registro, lo que permite a los futuros usuarios verificar que los contenidos del objeto son válidos (Gladney, 2004). Se requieren otras estrategias de retención, como la duplicación y la migración, para la retención a largo plazo de la certificación.

Sostenibilidad digital

La sostenibilidad digital abarca una serie de cuestiones y problemas que rodean la longevidad de la información digital. [8] A diferencia de las estrategias y soluciones tradicionales, tanto a corto como a largo plazo, la sostenibilidad digital implica un método de preservación más activo y continuo. Se centra menos en la solución y la tecnología y más en la construcción de una estructura y un enfoque que sea flexible, con un enfoque en la interoperabilidad, el mantenimiento regular a lo largo del tiempo y el desarrollo constante. [9] La sostenibilidad digital incorpora métodos aplicados en la actualidad que facilitan el acceso y la disponibilidad de material digital en un futuro más o menos lejano.

Estándar de preservación digital

Icono de lupa mgx2.svg El mismo tema en detalle: Open Archival Information System .

Para estandarizar la práctica de la preservación digital y brindar un conjunto de recomendaciones para la implementación del programa de preservación, se desarrolló un modelo de referencia para un Sistema de Información de Archivo Abierto (OAIS). El modelo de referencia (ISO 14721: 2003) incluye las siguientes directivas que un archivo OAIS siempre debe cumplir:

  • Negociar e intercambiar información apropiada con productores de datos digitales;
  • Obtener un control suficiente de la información proporcionada a un nivel que garantice la retención a largo plazo;
  • Determinar qué comunidad debe convertirse en una "comunidad de referencia" capaz de comprender la información proporcionada;
  • Asegurarse de que la información digital a conservar sea comprensible de forma autónoma para la comunidad de referencia. En otras palabras, la comunidad debería poder comprender la información incluso sin la ayuda de los expertos que produjeron la información;
  • Seguir las políticas y procedimientos documentados que garantizan que la información se mantenga a salvo de todos los riesgos razonables y que permitan la difusión de la información en copias certificadas del original o que se puedan rastrear hasta el original;
  • Hacer que la información digital se almacene y esté disponible para la comunidad de referencia [10] .

El OAIS se ocupa de todos los aspectos técnicos del ciclo de vida de un objeto digital: desde la colocación en un archivo hasta el almacenamiento en la infraestructura de almacenamiento, desde la gestión de datos hasta la accesibilidad y distribución. El modelo también aborda cuestiones de metadatos y recomienda que se asocien cinco tipos de metadatos con un objeto digital: la referencia del objeto (identificación), la procedencia (incluido un historial de almacenamiento), el contexto, la fijeza (indicadores de autenticidad) y la representación (formato, archivo estructura, y lo que "da significado al flujo de bits del objeto". [5]

Antes de la propuesta de Gladney para Objetos Digitales Certificados (TDO), el Grupo de Bibliotecas de Investigación (RLG) desarrolló los "atributos y responsabilidades" que denotan la práctica de un " Repositorio Digital de Confianza " (TDR). Los siete atributos de un TDR son: "cumplimiento del modelo de referencia para un Sistema de Información Abierto de Archivo (OAIS), responsabilidad administrativa, sustentabilidad organizacional, sustentabilidad financiera y tecnológica y adecuación procesal, seguridad del sistema, responsabilidad procesal". Las responsabilidades del RLG también incluyen recomendaciones para el desarrollo de un sistema de repositorio digital colaborativo y el intercambio de investigación e información sobre la preservación digital, incluidos los aspectos relacionados con los derechos de propiedad intelectual [11] .

Estándar de preservación de audio digital

En enero de 2004, el Council on Library and Information Resources (CLIR) organizó una reunión de expertos en sonido para discutir las mejores prácticas en la preservación de audio digital ; la reunión produjo un informe presentado en marzo de 2006 . Este informe investiga los procedimientos para reformatear el sonido analógico a digital y resume las discusiones y recomendaciones para las mejores prácticas de preservación digital. Los expertos distribuyeron un conjunto de 15 recomendaciones para mejorar la práctica de transferir audio analógico a digital para su almacenamiento:

  • Desarrollar habilidades básicas en el campo de la ingeniería de preservación de audio. Los participantes observaron con preocupación que el número de expertos calificados para la transferencia digital y el archivo de grabaciones de audio antiguas se está reduciendo y destacaron la necesidad de encontrar una manera de garantizar que los conocimientos técnicos de los expertos puedan compartirse con las generaciones posteriores;
  • Desarrollar convenios con instituciones más pequeñas que permitan compra cooperativa [ poco clara ] de materiales y suministros;
  • Seguir un programa de investigación para problemas de cintas magnéticas que se concentre en soluciones menos destructivas;
  • Desarrollar pautas para la transferencia automatizada de audio analógico a formato digital;
  • Desarrollar un lugar único (basado en una aplicación web) para compartir información sobre el desarrollo de programas de transferencia y preservación digital;
  • Llevar a cabo más proyectos de investigación sobre reproducción no destructiva de discos de audio dañados;
  • Desarrollar un diagrama de flujo para identificar la composición de los distintos tipos de cintas y discos de audio;
  • Desarrollar una tabla de referencia sobre los problemas más frecuentes relacionados con los medios digitales;
  • Catalogar los principales estándares de ingeniería de audio;
  • Estudie los métodos más seguros y efectivos para limpiar cintas y discos analógicos;
  • Desarrollar una lista de expertos en música a quienes se podría consultar para obtener consejos sobre la transferencia de tipos específicos de contenido musical (por ejemplo, determinar la clave correcta para determinar la mejor velocidad de reproducción);
  • Establecer archivos de audio digital por país;
  • Colaborar en el desarrollo de un vocabulario común en el campo de la preservación de audio;
  • Investigar la transferencia de tecnologías de campos como la química y la ciencia de los materiales para resolver los diversos problemas de preservación de artefactos de audio. [12]

La Asociación Internacional de Archivos Sonoros y Audiovisuales (IASA) también ha publicado directrices actualizadas sobre técnicas para crear y conservar material de audio digital. [13]

Ejemplos de iniciativas de preservación digital

  • Xena es un software de archivo gratuito basado en Java que se puede instalar en cualquier PC. Convierta documentos, gráficos y archivos de audio patentados en formatos abiertos y normalice otros archivos binarios a ASCII con un contenedor de archivos XML;
  • ArchivalWare (fabricado por PTF Inc.) es un Solución de biblioteca digital [ poco clara ] creada específicamente para acomodar, difundir, preservar y permitir la identificación de recursos digitales. El producto crea archivos PDF para la preservación digital a largo plazo e incluye soporte para metadatos XMP, lo que permite que los metadatos se incrusten permanentemente en el propio objeto digital;
  • DSpace es un software de código abierto que acepta datos digitales en diferentes formatos (texto, video, audio), los distribuye a través de la web, los indexa (para una fácil recuperación) y los guarda en el tiempo;
  • La Biblioteca Británica es responsable de varios programas en el área de preservación digital. Los Archivos Nacionales del Reino Unido también han allanado el camino para varias iniciativas en el campo de la preservación digital;
  • PADI es un repositorio completo de información sobre el tema de la preservación digital de la Biblioteca Nacional de Australia ;
  • SimpleDL es capaz de almacenar múltiples formatos, incluidos texto, imágenes, video, audio y datos. SimpleDL utiliza Amazon S3 para proporcionar una durabilidad del 99,999999999% de los datos digitales almacenados en su archivo.

Iniciativas de preservación digital a gran escala

Muchas bibliotecas y archivos han comenzado o están a punto de comenzar " Iniciativas de preservación digital a gran escala" (LSDI). Los protagonistas son instituciones culturales, empresas comerciales como Google y Microsoft , y grupos sin fines de lucro, entre ellos Open Content Alliance (OCA), Million Book Project (MBP) y HathiTrust . La principal motivación de estos grupos es ampliar el acceso a los recursos académicos, especialmente en una visión a largo plazo.

Una treintena de instituciones culturales, incluidos doce miembros del Comité de Cooperación Institucional (CIC), han firmado acuerdos de digitalización tanto con Google como con Microsoft. Muchas de estas instituciones culturales están participando en Open Content Alliance (OCA) y Million Book Project (MBP). Algunas bibliotecas están involucradas en una sola iniciativa, mientras que otras han diversificado sus estrategias de digitalización mediante la participación en múltiples iniciativas. Las principales razones expuestas para que las bibliotecas participen en los programas de LSDI son el acceso, la preservación, la investigación y el desarrollo. Se espera que la preservación digital garantice que el material en poder de las bibliotecas siga siendo accesible para las generaciones futuras. Las bibliotecas tienen previsto utilizar en el futuro copias digitalizadas como copias de seguridad de obras en riesgo de deterioro en caso de que se agoten, se deterioren, se pierdan o sufran daños irreparables.

Nota

  1. ^ Brewster Kahle preservando Internet . "Scientific American", 276 (1997), n. 3, pág. 72-74. Verificado el 5 de febrero de 2011
  2. ^ Levy, DM & Marshall, CC (1995), Going digital: una mirada a los supuestos subyacentes a las bibliotecas digitales , en "Communications of the ACM", 58, No. 4: págs. 77-84.
  3. ^ Flugstad, Myron (2007), Archivo de sitios web: la preservación a largo plazo de los recursos digitales de origen local , Bibliotecas de Arkansas vol. 64 n. 3 (otoño de 2007) págs. 5-7.
  4. ^ Referencia de palabras: "refrescante" , en wordreference.com . Consultado el 3 de enero de 2019 .
  5. ^ a b Biblioteca de la Universidad de Cornell. (2005) Políticas de gestión de preservación de colecciones digitales: estrategias a corto plazo para contrarrestar problemas a largo plazo Archivado el 14 de enero de 2014 en Internet Archive .
  6. ^ Grupo asesor del marco de NISO. (2007). A Framework of Guidance for Building Good Digital Collections, 3.a edición Archivado el 17 de mayo de 2008 en Internet Archive ., P. 57,
  7. ^ Iniciativa nacional para un patrimonio cultural en red. (2002). NINCH Guía de buenas prácticas en la representación y gestión digitales de materiales del patrimonio cultural Archivado el 8 de diciembre de 2007 en Internet Archive .
  8. ^ Bradley, K. (verano de 2007). Definición de sostenibilidad digital. Tendencias bibliotecarias v. 56 no 1 p. 148-163.
  9. ^ Sostenibilidad de los recursos digitales. (2008). TASI: Servicio de Asesoramiento Técnico de Imágenes. Archivado el 4 de marzo de 2008 en Internet Archive .
  10. ^ Comité Consultivo de Sistemas de Datos Espaciales. (2002). Modelo de referencia para un sistema de información de archivo abierto (OAIS). Washington, DC: Secretaría de la CCSDS, pág. 3-1
  11. ^ Grupo de bibliotecas de investigación. (2002). Repositorios digitales de confianza: atributos y responsabilidades Archivado el 20 de febrero de 2008 en Internet Archive .
  12. ^ Consejo de recursos de información y bibliotecas. Publicación 137: Captura de sonido analógico para la preservación digital: Informe de una mesa redonda sobre las mejores prácticas para transferir discos y cintas analógicas Marzo de 2006 Archivado el 20 de septiembre de 2008 en Internet Archive .
  13. ^ IASA (2009). Directrices sobre la producción y preservación de objetos de audio digital archivadas el 8 de mayo de 2015 en Internet Archive .

Artículos relacionados

Otros proyectos

enlaces externos

Control de autoridad Tesauro BNCF 52292 · LCCN (EN) sh95004496 · BNF (FR) cb119595620 (fecha) · NDL (EN, JA) 01,056,398