blog.hiperbibliotecas.org: Optimizando los procesos de digitalización: Lectura automática en el servidor

La lectura automática en el servidor de documentos digitalizados en
múltiples puntos puede usarse para optimizar procesos de digitalización

Como hemos comentado recientemente, criterios de Arquitectura de Información pueden usarse para optimizar procesos de digitalización masiva o descentralizada. Esta optimización es muy relevante porque tiene una gran influencia en los costos de los procesos y en la eficiencia institucional. En el caso de la digitalización masiva porque las mejoras o los problemas de los procesos se aprovechan o repercuten centenares o miles de veces, debido a la gran cantidad de páginas que se digitalizan. En el caso de los procesos descentralizados, porque el hecho de realizar la digitalización directamente en las oficinas donde están los documentos físicos puede abreviar significativamente o no los costos de traslado de valijas y hacer mucho más expeditos los procesos orgánicos institucionales.

Como hemos visto, en la optimización se trata de aplicar en el diseño de los procedimientos de digitalización conceptos que se desprenden de factores como la comprensión de la transición de tipos de archivos que se realizará. Por ejemplo, si un documento está ligado a cliente y a un trámite, hay que preguntarse cómo debe ser el procedimiento de guardar el documento digitalizado: ¿Identificando primero al cliente? ¿Identificando primero al trámite? ¿Por fecha? La respuesta, como vimos hace un par de semanas, a la pregunta del procedimiento que mejor trabaja es: guardando todos los archivos que almacenan las imágenes digitales de los expedientes en carpetas nombradas con el código que identifica ese expediente en el archivo de documentes de papel. Ese sólo hecho permite que se pueda programar una lectura y asociación automática en el servidor de destino, como explicaremos más adelante. También tiene la gran ventaja de que el trabajo del operador y las destrezas requeridas son menores (Ver Digitalización de los documentos de Clientes).

Otro ejemplo de optimización tiene lugar cuando se usan tecnologías y procedimientos programados para evitar los retrasos por upload, realizando subidas asíncronas de los archivos digitalizados, en forma automática, desde los puntos de digitalización hasta directorios convenidos en el servidor, cómo explicamos la semana pasada (Ver Retrasos de Upload en proyectos de digitalización). La aplicación de este este tipo de soluciones genera, como vimos en su oportunidad, ahorros significativos de tiempo y de costos.

Cuando se combinan estas dos formas de optimización de la digitalización de documentos, las imágenes digitalizadas llegan al servidor y pueden ser cargados automáticamente en bases de información y/o bases de datos a través de procesos de lectura automática. Muchas veces se piensa en soluciones sofisticadas que usan OCR (reconocimiento óptico de caracteres impresos) e ICR (reconocimiento óptico de manuscritos) para leer las imágenes digitales en campos predefinidos, pero estas no siempre aplican, porque son soluciones muy costosas o porque los documentos digitalizados, por ejemplo, actas, reglamentos o constancias no tienen patrones con campos definidos.

Pero hay un tipo de lectura automática que es muy sencilla y muy eficiente. En el servidor un programa puede recorrer cada carpeta subida asíncronamente desde los puntos de digitalización, usar el nombre de la carpeta en el sistema de archivos para identificar al trámite (según la convención acordada) y el trámite así identificado para encontrar la o las personas vinculadas. Como todas las imágenes digitalizadas que están en la carpeta fueron capturadas desde los documentos del expediente de papel del trámite que se procesa, es muy fácil organizar en forma automática la incorporación a los sistemas de almacenamiento del Archivo digital. Todas las imágenes en la carpeta digital leída en el servidor se asocian al trámite y así, cada vez que se sube una carpeta asíncronamente, se lee automáticamente en el servidor y se incorpora a la base de datos o base de información correspondiente. Estas tres actividades de optimización suelen representar una mejora muy significativa en la eficiencia institucional.

viernes, 26 de septiembre de 2014

Optimizando los procesos de digitalización: Lectura automática en el servidor

No hay comentarios:

Bienvenidos al Blog de Hiperbibliotecas (www.hiperbibliotecas.org)

Temas

Suscribirse a http://blog.hiperbibliotecas.org

Libro "La biblioteca hiperautomatizada"

Archivo del blog