viernes, 24 de junio de 2011

Las nuevas ideas en los protocolos de la iniciativa de archivos abiertos

El protocolo OAI-OMH permite cosechar metadatos
desde varios tipos de proveedores de datos y reunirlos
en un servidor local para prestar con ellos algún tipo de
servicio de valor agregado
Como hemos estado trabajando en una serie de post, el OAI-PMH puede considerarse como el primer protocolo de intercambio de metadatos sencillo y por tanto, fácilmente adoptable por múltiples tipos de instituciones. Más allá de todos los detalles técnicos, que no interesan a muchos de nuestros lectores, está la pregunta de cuál fue la idea disruptiva, la chispa básica del movimiento hacia la simplificación que se inició en el nuevo milenio. No cabe duda que (como expusimos hace unas semanas), el cambio fundamental significó el desprenderse de la idea, teóricamente eficiente, de que consultar en tiempo real múltiples repositorios era lo mejor. La alternativa fue buscar un esquema más plano. Pragmáticamente, plantearse traer a un servidor local registros de datos recuperados a través de un protocolo de cosecha universal. Exploramos en este post las nuevas ideas que aportó la iniciativa de archivos abiertos.

Una nueva visión del intercambio de metadatos
Dentro de la Open Archive Initiative en el mundo hay Provedores de datos y Proveedores de servicios. Los primeros crean repositorios de metadatos y los segundos cosechan los metadatos de varios repositorios y generan valor agregado, es decir, nuevos servicios.

La metáfora de la cosecha viene porque se trae hasta un cierto lugar, el lugar de la recolecta, la información cultivada (es decir, creada, catalogada) por los Proveedores de Datos.

Los metadatos se comunican a través de registros que tienen un identificador único para cada uno. La idea es que siempre sea posible saber el origen de un determinado registro recolectado. Quién fue su proveedor y cómo se puede acceder al registro original. De esta manera el Proveedor de servicios puede aportar su valor agregado a partir del reconocimiento del mérito del productor original.

Puede notarse que esta es una visión muy diferente a la de compartir en tiempo real, donde se hace una pregunta a múltiples servidores y se espera que nos llegue la consolidación de todas las respuestas independientemente de las diferencias técnicas entre los distintos servicios.

El papel de Dublin Core en OAI
Los registros de metadatos que se intercambian con OAI-PMH se escriben según un esquema o formato preestablecido, como, por ejemplo Dublin core. Esta idea es importante porque permite mezclar, combinar, registros provenientes de distintas partes manteniendo la consistencia de la información. El hecho de que sea Dublin Core el formato de metadatos elegido como base es también interesante, porque por la naturaleza simple y universal de este esquema de metadatos, permite asegurar que siempre se puede lograr la consolidación de la información proveniente desde variados repositorios, archivos y bibliotecas.

Por otra parte, para permitir redes especializadas, el protocolo OAI-PMH es compatible con el uso de varios formatos de metadatos, es decir, no obliga a usar exclusivamente el esquema de Dublin Core. Lo que se exige es que siempre se pueda solicitar la expresión de un registro cosechado bajo Dublin Core. Es decir, otro u otros formatos para organizar y presentar los metadatos son bienvenidos con tal de que el Dublin Core esté en el grupo de formatos de metadatos implementados. Eso significa una garantía de que luego de cosechar registros desde varios repositorios de metadatos estos se podrán reunir bajo, al menos, un esquema que está presente en todos.

Usuarios, registros y recursos
Los usuarios pueden consultar libremente los Proveedores de servicios de valor agregado y a partir de ellos acceder a los Proveedores de datos originales, que siempre son referenciados.

Cada registro de metadatos es, al final, una representación de un item existente en algún repositorio y al cosechar el registro siempre se mantiene el conocimiento de la referencia, así como estos ítems a su vez representan recursos de naturaleza lógica o física que existen en algún sitio.

No hay comentarios: