viernes, 2 de mayo de 2014

El registro de metadatos en un proyecto de digitalización de volumen

En un proyecto de digitalización masiva se realiza la captura digital de miles
a millones de documentos. El número de metadatos a identificar y registrar
en estos proyectos es una de las decisiones críticas que los
responsables de servicios deben tomar
Hemos estado conversando acerca de la digitalización de volumen. En nuestro post anterior nos detuvimos en la Planificación de la digitalización y en particular, en las decisiones vinculadas a las imágenes. Manteniéndonos en el tema de la Planificación hoy queremos ir al punto de las decisiones vinculadas al registro de metadatos. Son también muy importantes en su contribución al éxito y el resultado final del proyecto de digitalización.

No hay que perder de vista que la digitalización no se hace como un fin en sí mismo. No se justifica simplemente por alinearse con las nuevas tecnologías. El sentido que tiene, como lo hemos explicado en varias oportunidades, es mejorar la eficiencia de la institución donde se realiza, en su práctica regular. Esto es uno de los ingredientes centrales que debe tomarse en cuanta a la hora de decidir qué metadatos se registran en la base de información que se construye durante el proceso de digitalización.

Se deben seleccionar los campos a registrar para mejoran la encontrabilidad de la información en los servicios cotidianos y para hacer más eficiente la búsqueda y la realización del manejo recurrente de la información (Ver: Arquitectura de información) .

Mientras más campos de información se registren, normalmente se puede prestar un mejor servicio, la búsqueda luego de la digitalización será más fácil, segura y rápida y además los trámites típicamente mejoran en su eficiencia. Sin embargo, no se trata de registrar muchos campos por dos razones: la primera es su impacto en los costos del proyecto y la segunda es que siempre hay un punto a partir del cual aumentamos la complejidad pero no el valor de la solución.

El impacto en los costos tiene que ver por el efecto de multiplicación que ocurre cuando se trabaja con un volumen grande documentos. Registrar un campo de información implica reconocer el metadato y cargarlo en la base de información. Esto toma un tiempo. Puede ser relativamente pequeño al considerar un registro individual y un campo dentro de ese registro. Pero aumenta con el número de campos y se magnifica con el número de documentos a trabajar ya que las cantidades de éstos en un proyecto de digitalización masiva son altas: desde miles a millones.

Los números a tomar en cuenta crecen rápidamente. Por ejemplo, si identificar un campo en un documento de papel y cargarlo en la base de información toma, en promedio, 5 minutos de trabajo, y en un determinado proceso se desea hacerlo en cuatro campos de cada documento, significa que se requieren veinte minutos por documento. Esto se traduce en un máximo de tres documentos por hora, lo que tiene un gran impacto en el proyecto.

Si se trata de proyecto de sólo doscientos mil documentos, se requerirán alrededor de 67.000 horas de trabajo. Si se trabaja con dos turnos de 6 horas cada uno se necesitarán cerca de cinco mil días de trabajo. Si diez personas trabajan en cada turno durante 20 días al mes durante los doce meses al año aún se requerirán dos años de trabajo para completar este registro masivo de información. Es decir, para sólo 200.000 documentos, se requieren 20 personas en la actividad de registro para lograr finalizar el proyecto en 2 años. En lugar de ello, si se registra sólo un par de campos en lugar de los cuatro usados en el cálculo anterior, el proyecto podrá terminarse en sólo un año.

En conclusión, el número de campos a registrar es crítico, y la decisión de con cuáles trabajar puede ser crucial. Este debe ser comprendido por los gerentes y responsables de servicios ya que lo deben tomar en cuenta en el momento de planificar proyectos de digitalización de volumen.

No hay comentarios: