viernes, 17 de junio de 2011

La Iniciativa de archivos abiertos: El nacimiento de la sencillez al compartir metadatos

Fotografía del nacimiento del río Mundo.
La iniciativa de archivos abiertos originó un río de ideas
frescas que permitieron redefiniór el
cómo compartir metadatos en el mundo.

La Iniciativa de Archivos Abiertos (OAI, por su siglas en inglés) y su protocolo base, el OAI-PMH, representó histórica y conceptualmente, un salto cualitativo. Como hemos estado conversando, no era suficiente tener un esquema de descripción sencilla de metadatos, como Dublin Core, para lograr que el compartir metadatos fuese práctico. Fue necesaria la experiencia implementando el protocolo Z39.50 (ver nuestro post del viernes 3 de junio: ¿Por qué cosechar en lugar de buscar en tiempo real los metadatos que necesitamos?) y la presión que se generó para buscar y compartir desde los repositorios de documentos académicos como ArXiv (ver nuestro post previo: Los pioneros de la cosecha de metadatos…) para crear las condiciones que finalmente permitieron concretar la idea de que recolectar metadatos con el objeto de producir con ellos valor agregado era, en muchos casos, mejor que buscar. Con estos antecedentes claros estamos en condiciones de entender las ideas que marcaron el cómo hacer sencillo compartir metadatos, un tema de interés para estudiantes y profesionales de información. Explicamos en este post los tres legos fundamentales.

El desiderátum en la iniciativa de archivos abiertos
El protocolo OAI-PMH fue un evento fundacional en la iniciativa de archivos abiertos. Se diseñó con la intención de concretar un marco de trabajo para la interoperabilidad de repositorios académicos, permitiendo a los proveedores de servicios de información cosechar metadatos desde proveedores de datos. La idea era facilitar el que los proveedores de servicios pudieran proporcionar valor agregado a los usuarios a partir de la combinación de la información recabada en sus servidores, después de recolectar metadatos desde los repositorios donde estos estaban originalmente almacenados. La cosecha de metadatos se convertiría así en una práctica regular, sistemática, simple. Debería realizarse en forma periódica e incremental, es decir, sólo se cosecharía desde un repositorio lo que hubiese cambiado desde la última vez que se cosechó. El protocolo debería asegurar que la recolección incremental de los metadatos, así como su interpretación, fuese un proceso sencillo y sin ambigüedades. Debería haber facilidades para recolectar subconjuntos de un repositorio.

De la gestión de e-prints a numerosas bibliotecas
Históricamente, el protocolo OAI-PMH nació por motivación de los pioneros de la Iniciativa de Archivos Abiertos (OAI) que buscaban una manera de tener estándares y un marco tecnológico para compartir documentos electrónicos de contenido académico, conocidos como archivos de e-prints.

Sin embargo, la solución fue tan práctica que se convirtió en un estándar amplio para compartir metadatos públicos, por lo que muchas instituciones y servicios, que ofrecían metadatos o que los requerían, comenzaron su adopción, en particular, muchas bibliotecas digitales e híbridas.

Los tres legos principales
Tres legos que existían previamente se combinaron en el diseño de la Iniciativa de Archivos Abiertos. Estos legos fueron posteriores al Z39.50 y sintetizaban un conocimiento básico que se requería para el salto hacia delante que significó el OAI-PMH.

Las tres piezas fundamentales fueron: el HTTP o protocolo de la WWW, que facilitaba el intercambio de contenidos a través de la Internet, el Dublin Core, que creó un esquema de metadatos sencillo, universal y manejable como base para el intercambio y mezcla de contenidos nacidos en distintas instituciones y dominios de conocimiento y el XML, que estableció una manera simple y universal de escribir los metadatos en archivos físicos.

Cuando arrancó el Z39.50 no se había universalizado la Web y por eso el método básico para compartir era el protocolo base de la Internet, el TCP-IP. Esto significaba significaba poder, pero también dificultades técnicas. No se había desarrollado la Iniciativa de Dublin Core, y por eso el esquema base de intercambio fue el MARC, prolijo y exhaustivo, pero complejo.

En ausencia de algo como el XML, un esquema universal para los archivos físicos de metadatos, se usaban patrones de archivos definidos ad-hoc, como en su momento lo hicieron los autores del MARC. Esta manera de trabajar no era sencilla, no facilitaba el reuso de las aplicaciones ni la validación automática de archivos de metadatos. Esta facilidades tuvieron que esperar al OAI-PMH.

Era otra época. Por eso, puede decirse con propiedad, la frase con la que titulamos este post: con el advenimiento de la Iniciativa de Archivos Abiertos nació la sencillez en protocolos para compartir metadatos.

No hay comentarios: