viernes, 30 de mayo de 2014

La línea de producción de bits

En la digitalización de volumen el diseño del proceso de captura digital y la planificación del proyecto son actividades muy críticas. Hay que evitar los errores, dado que éstos se multiplican por el número de páginas digitalizadas y éste número es alto por definición en los procesos masivos. Pero después del diseño, de la consideración de alternativas, de la definición de políticas de organización, digitalización y registro, de la conformación de unidades de digitalización, de las definiciones acerca de la ruta física de los documentos, de la selección e instalación de equipos y de las pruebas de digitalización de una muestra representativa de los documentos a digitalizar, se arranca la línea de producción de bits: la captura masiva de las imágenes digitales de los documentos. Es lo que describimos en este post.

La línea de producción de bits de un típico proceso de digitalización masiva comienza con la valoración inicial, la consideración de los documentos para determinar lo que va a ser digitalizado. Los documentos son agrupados en lotes, paquetes o cajas que son trasladados hasta el lugar de digitalización. En la salida del archivo se registra lo que va en cada paquete y se crea una etiqueta que es leída en el lugar de digitalización para control del flujo de los documentos. En el lugar de digitalización los documentos son rápidamente evaluados para determinar lo que debe ser digitalizado y registrado. Esto puede ser una actividad rápida y sencilla. Por ejemplo, si se digitaliza un archivo fotográfico y todas las fotos son digitalizadas no hay mucho que considerar. Pero también puede ser un trabajo más complejo. Por ejemplo, si se digitalizan expedientes de personas, pero debe seleccionarse con ciertos criterios definidos con anterioridad cuál es la porción del expediente que se digitalizará.

La digitalización y el registro pueden ser operaciones simultáneas y síncronas o pueden ser completamente paralelas y asíncronas. La manera de sincronizar en el caso en que las actividades sean paralelas es muy variada. Una manera sencilla es hacerlo a través del uso del código de identificación que se tenga para las personas (el número de identificación nacional, el número de identificación en la institución, etc) como el nombre del archivo que contiene la imagen si el proceso diseñado crea una única imagen por persona o como nombre de directorio si se crean varias imágenes por documento. Esta forma de trabajar tiene la ventaja de que un prgrama puede luego asociar automáticamte todo lo digitalizado a los expedientes digitales ahorrando un tiempo considerable de trabajo.

Otra manera típica de trabajar es que cada imagen digitalizada se abre en media pantalla y se usa la otra media pantalla para transcribir los campos extraídos de la imagen digital. Si se usan pantallas grandes o apaisajadas esta forma de trabajar puede ser bastante cómoda. La extracción y transcripción como tal puede realizarse a través de lectores  humanos o automatizados. En este último caso se usan técnicas de reconocimiento de caracteres (OCR o ICR, según sea el caso), pero sólo después de probar que funcionan en forma aceptable dentro del tipo de aplicación.

El resultado de la digitalización y el registro son revisados por parte del personal de aseguramiento de la calidad. Puede ser un muestreo parcial o realizarse sobre todas las imágenes.  Los errores se corrigen y en algún punto se realiza la catalogación.

La catalogación o intexación es una actividad de asignación de etiquetas usando un vocabulario definido y controlado. Puede realizarse físicamente en el mismo lugar de la digitalización o en un lugar completamente diferente aprovechando la ubicuidad de las tecnologías de la información.  La catalogación puede, incluso, ser un proceso diferido en el tiempo y debe notarse que requiere su propia actividad de aseguramiento de la calidad.

Cada vez que interviene una persona que realiza una parte de la actividad se debe registrar una pequeña constancia de lo realizado para poder monitorear el proceso. Estos registros permiten tener idea de los avances (retrasos o eventuales cuellos de botella) del proceso.

Típicamente hay un supervisor por cada unidad de producción de digitalización, uno en cada turno en el caso de que hay varios turnos. Estos supervisores determinan si hay problemas técnicos o fallas en las políticas de producción o de calidad que deban subsanarse.

No hay comentarios: