viernes, 26 de septiembre de 2014

Optimizando los procesos de digitalización: Lectura automática en el servidor


La lectura automática en el servidor de documentos digitalizados en
múltiples puntos puede usarse para optimizar procesos de  digitalización
Como hemos comentado recientemente, criterios de Arquitectura de Información pueden usarse para optimizar procesos de digitalización masiva o descentralizada. Esta optimización es muy relevante porque tiene una gran influencia en los costos de los procesos y en la eficiencia institucional. En el caso de la digitalización masiva porque las mejoras o los problemas de los procesos se aprovechan o repercuten centenares o miles de veces, debido a la gran cantidad de páginas que se digitalizan. En el caso de los procesos descentralizados, porque el hecho de realizar la digitalización directamente en las oficinas donde están los documentos físicos puede abreviar significativamente o no los costos de traslado de valijas y hacer mucho más expeditos los procesos orgánicos institucionales.

Como hemos visto, en la optimización se trata de aplicar en el diseño de los procedimientos de digitalización conceptos que se desprenden de factores como la comprensión de la transición de tipos de archivos que se realizará. Por ejemplo, si un documento está ligado a cliente y a un trámite, hay que preguntarse cómo debe ser el procedimiento de guardar el documento digitalizado: ¿Identificando primero al cliente? ¿Identificando primero al trámite? ¿Por fecha? La respuesta, como vimos hace un par de semanas, a la pregunta del procedimiento que mejor trabaja es: guardando todos los archivos que almacenan las imágenes digitales de los expedientes en carpetas nombradas con el código que identifica ese expediente en el archivo de documentes de papel. Ese sólo hecho permite que se pueda programar una lectura y asociación automática en el servidor de destino, como explicaremos más adelante. También tiene la gran ventaja de que el trabajo del operador y las destrezas requeridas son menores (Ver Digitalización de los documentos de Clientes).

Otro ejemplo de optimización tiene lugar cuando se usan tecnologías y procedimientos programados para evitar los retrasos por upload, realizando subidas asíncronas de los archivos digitalizados, en forma automática, desde los puntos de digitalización hasta directorios convenidos en el servidor, cómo explicamos la semana pasada (Ver Retrasos de Upload en proyectos de digitalización). La aplicación de este este tipo de soluciones genera, como vimos en su oportunidad, ahorros significativos de tiempo y de costos.

Cuando se combinan estas dos formas de optimización de la digitalización  de documentos, las imágenes digitalizadas llegan al servidor y pueden ser cargados automáticamente en bases de información y/o bases de datos a través de procesos de lectura automática. Muchas veces se piensa en soluciones sofisticadas que usan OCR (reconocimiento óptico de caracteres impresos) e ICR (reconocimiento óptico de manuscritos) para leer las imágenes digitales en campos predefinidos, pero estas no siempre aplican, porque son soluciones muy costosas o porque los documentos digitalizados, por ejemplo, actas, reglamentos o constancias no tienen patrones con campos definidos.

Pero hay un tipo de lectura automática que es muy sencilla y muy eficiente. En el servidor un programa puede recorrer cada carpeta subida asíncronamente desde los puntos de digitalización, usar el nombre de la carpeta en el sistema de archivos para identificar al trámite (según la convención acordada) y el trámite así identificado para encontrar la o las personas vinculadas. Como todas las imágenes digitalizadas que están en la carpeta fueron capturadas desde los documentos del expediente de papel del trámite que se procesa, es muy fácil organizar en forma automática la incorporación a los sistemas de almacenamiento del Archivo digital. Todas las imágenes en la carpeta digital leída en el servidor se asocian al trámite y así, cada vez que se sube una carpeta asíncronamente, se lee automáticamente en el servidor y se incorpora a la base de datos o base de información correspondiente. Estas tres actividades de optimización suelen representar una mejora muy significativa en la eficiencia institucional.

viernes, 19 de septiembre de 2014

Retrasos de Upload en proyectos de digitalización

La subida al servidor de archivos generados en la captura digital
  genera retrasos y costos significativos
cuando los procesos de digitalización no están bien diseñados
Muchos proyectos de digitalización fallan o no resultan adecuados porque son diseñados sin criterios de Arquitectura de Información. Los resultados que se logran son análogos a los que obtendrían si se intenta construir un edificio sin llamar a un Arquitecto, sólo con obreros y un maestro constructor. Uno de los problemas que se presenta en específico en los proyectos de digitalización es el de los retrasos por Upload o subida de archivos al servidor. Se presenta cuando la digitalización no se realiza centralizada, en la misma red local donde reside el servidor que guardará los archivos digitalizados, lo cual es muy frecuente.

Aclaramos que este es sólo uno de los problemas que se presentan en un proceso de digitalización que no ha sido bien diseñado. Hemos conversado sobre los problemas generales de diseño de procesos de digitalización en varias oportunidades. Ver por ejemplo: La digitalización no siempre funciona, Digitalización exitosa, El diseño de la digitalización y La Línea de producción de bits. Por eso hoy queremos concentramos en el tema señalado: cómo eliminar el retraso por Upload.

Primero comprendamos el origen de la dificultad: en muchos casos es más conveniente un proceso de digitalización descentralizado, digitalizar en las oficinas regionales o alternas, donde están los documentos en papel. La razón es clara: si se digitaliza en forma descentralizada el papel no tiene que trasladarse. Esto evita el incurrir en un costoso movimiento de valijas. Pero hay problemas técnicos que se generan, y es que los documentos digitalizados son realmente útiles cuando residen en un servidor al cual se tiebe acceso desde la red.

Tener múltiples servidores, uno en cada punto de digitalización, y descentralizar así, físicamente, un archivo digital, tiene poco sentido. Por eso los documentos digitalizados deben ser enviados normalmente a un servidor central. Pero esto puede implicar que el personal que digitaliza tiene que esperar que sus archivos digitalizados suban al servidor central antes de continuar con el siguiente documento. Algunos archivos pueden ser grandes por lo que el retraso en la subida al servidor puede ser importante. Pero incluso, cuando los archivos no son tan grandes, si el proceso de digitalización tiene cierto volumen, y hay que digitalizar centenares o miles de documentos, los pequeños retrasos se suman, por lo que el tener que esperar por la subida al servidor hace, en general, la operación global lenta y ello significa, al final del camino, aumento de los costos del proyecto.

Afortunadamente hoy día hay soluciones interesantes. Un Arquitecto de Información formado propondrá, normalmente, una subida asíncrona, esto significa que el operador que realiza la digitalización sólo se ocupa de digitalizar guardando los archivos en su máquina local, ya que un proceso de automático y asíncrono, es decir, a su propio ritmo, llevará los archivos digitalizados por cada operador al servidor central. Esto se hará como un proceso fondo, sin que nadie este esperando por ello. Del lado del servidor alguna herramienta los procesará a media que vayan llegando.

Cuando se implementa así el servicio de digitalización no está limitado en absoluto por los tiempos de subida de los archivos al servidor. Sólo por el proceso de captura digital en si. Por la formación de los operadores (ver La gente que digitaliza y el proceso de digitalización), por el tipo de escáneres usados.(ver Los escáneres en la digitalización de volumen)

Por esta razón, esta pura directriz de diseño (subir los digitalizado en forma asíncrona) normalmente implica una gran diferencia en la eficiencia del proceso de digitalización y elimina completamente los retrasos por Upload. Conversaremos algunos otros puntos claves del diseño de procesos de digitalización en siguientes oportunidades.

viernes, 12 de septiembre de 2014

La carga digital de documentos en un archivo único de clientes

El conocimiento de Arquitectura de Información agiliza significativamente
los procesos de carga digital de documentos
Cuando se quiere incorporar documentos de papel a un archivo digital el diseño del proceso es crítico. Como explicamos la semana pasada, muchas veces se llama a esto “Digitalización” y por allí comienza el problema porque se pone el acento en el mero cambio de tipo de medio, el pase de la información en papel a los sistemas digitales, sin revisar el detalle de los procesos  subyacentes.  El resultado se traduce en costos excesivos que son producto de la ineficiencia de los procesos. Para hacerlo distinto hay que diseñar los procedimientos de captura digital, lectura inteligente de información y la identificación de documentis con Arquitectura de Información  ¿Cómo realizar entonces la incorporación a un Archivo Único Digital de clientes de los documentos en papel que tenemos en carpetas identificadas, por ejemplo, con un código de operación? Es el tema de hoy.

El primer aspecto del que tenemos que percatarnos es que si bien digitalmente tendremos muchas maneras de manejar la información al momento de organizar la captura digital, es mejor que usemos para la carga de información el criterio de clasificación de las carpetas que contienen los documentos en papel que digitalizaremos. Así el proceso automatizado de captura digital será más rápido y menos exigente para el operador. Si las carpetas de documetnos en papel se identifican, por ejemplo, con un código de operación, no es apropiado organizar el proceso de captura digital por clientes, sino por operación (el criterio usado en las carpetas de papel). Como cada operación está ligada a un cliente, el sistema de información digital es quien tiene que identificar (automáticamente) al cliente cuando los documentos son leidos inteligentemente, no el usuario antes de digitalizar.

En una carpeta a digitalizar normalmente hay varios tipos de documentos: por ejemplo información fiscal, actas de constitución, etc. Una segunda idea importante es que si el usuario tiene que identificar cada tipo documento antes de digitalizar, el proceso de digitalización es lento y eso, en un proceso masivo, es costoso.  Por eso es mejor digitalizar los documentos sin preocuparse nombre del archivo, ni del cliente, sino sólo del código de la operación. Se digitalizan todos los documentos y se guardan con nombres automáticamente asignados, arbitrarios, sólo identificados por el nombre de la carpeta digital donde residen y que se identifica con el código de la operación.

Esto convierte la digitalización en una operación rápida y de poca exigencia analítica. Sólo se requiere saber usar el escáner. Los documentos digitalizados en la red se identifican en grupos que los asocian a una operación simplemente porque están en un directorio cuyo nombre es un código de operación. De esta manera las ventajas de la tecnología digital comienzan a operar. La identificación de detalle de los documentos digitalizados y revisión de los mismos, la carga de las fechas de vigencia, se pueden hacer en forma centralizada y asíncrona, como un pos proceso de la digitalización, desde cualquier punto de la red.

Si la digitalización es en línea, se depende de hacer consultas al sistema para cada documento digitalizado. Esto hace el proceso sumamente demorado, impráctico y aumenta los costos de procesamiento tanto en la operación masiva como en la operación con múltiples oficinas. Por eso es mejor que la digitalización ocurra fuera de línea y que el procesamiento en línea sea posterior, asíncrono, basado en el código de la operación que identifica a la carpeta digital. Esto tiene una ventaja adicional, la subida  de información a un servidor centralizado puede ocurrir asincrónicamente por lo que para todo efecto práctico, no hay en el proceso, tiempos de subida de información al servidor con personas esperando a que esto ocurra.

La revisión de los documentos digitalizados, su identificación, la carga de las fechas de vigencia y cualesquiera otras variables pertinentes, su incorporación al archivo digital, el aseguramiento de la calidad y cualquier otro pos procesamiento pueden hacerse desde cualquier punto de la red, por un archivo digital inteligente, que le presenta al usuario encargado la información digitalizada pendiente de  procesamiento. Como este usuario recibe la información desde el servidor y no desde el punto de digitalización la actividad no tiene nunca que esperar por los tiempos de subida de la información al servidor y es por tanto muy eficiente y puede realizarse tanto en el procesamiento masivo por lotes como en el procesamiento puntual.

Pero hay más aportes que las ideas que emanan del conocimiento de  Arquitectura de Información pueden hacer en la carga de información en los sistemas de archivo digital. Así que volveremos al tema en una siguiente oportunidad.

viernes, 5 de septiembre de 2014

Digitalización de los documentos de Clientes

La cultura del papel lamentablemente impregna muchos procesos de
digitalización y por ello éstos terminan siendo ineficientes
Muchas veces la confusión y las malas prácticas comienzan en proyectos o iniciativas a los que se les da un título como el de este post. Varios errores se concatenan a partir de allí. Uno frecuente, tiene que ver con el hecho de que se construyen los archivos de los clientes con modelos que responden más a la cultura del papel, que a la cultura digital. Sobre esto hemos estado conversando en nuestros últimos post por lo que no lo haremos hoy, y antes bien partimos de la premisa que se ha construido un buen Archivo Único Digital de Clientes, con buenas prácticas de Arquitectura de Información y que lo que se quiere resolver es estrictamente la carga digital de la documentación en papel que nos entregan los usuarios y clientes en ese archivo digital. Entenderemos en esta oportunidad la naturaleza de las dificultades en función de prepararnos para poder conversar de las mejores alternativas de diseño.

A los lectores interesados en conocer qué es desarrollar Archivos de clientes con modelos de la cultura del papel les remitimos a nuestros post recientes. Ver por ejemplo:  El mérito no viene de los computadores: ¿Cómo describimos nuestras operaciones en un archivo digital?¿Qué debería ser el expediente digital de un cliente? y Expedientes físicos y diseño de un Archivo Digital sin la cultura del papel.

El tema de hoy es que incluso cuando el Archivo digital ha sido bien creado, aún hay problemas prácticos a resolver en relación a la carga de documentos.  ¿Cómo cargar en forma masiva los documentos de papel que se tienen en los archivos actuales? ¿Cómo hacer de una forma efectiva la carga cotidiana de todos los documentos en papel que nos entregan en el contexto de las nuevas transacciones? ¿Cómo hacer esta carga de una manera costo-efectiva, cuando  se tienen oficinas en varias ciudades y/ o en varios en varios puntos de una misma ciudad?

Según como se contesten estas preguntas el resultado puede ser más o menos eficiente y la solución digital más o menos viable, con independencia de la tecnología empleada, ya que el problema principal no es de tecnología, computadores y programas sino, en primer lugar, de diseño de procesos con Arquitectura de información.

Precisamente por ello otra vez vuelve a surgir el problema de la carga pesada que significan las ideas heredadas de la cultura del papel.  Veamos: Se tiene en la mano una carpeta con los documentos que nos entregó un cliente en el contexto de una operación o transacción determinada y queremos digitalizarlos de forma que queden disponibles en toda la red de oficinas y útiles en todos los contextos.  El proceso lógico normalmente se resume en identificar en el sistema el cliente, buscar la operación con la que estamos trabajando, y una vez allí digitalizar uno a uno los documentos que están en la carpeta, identificarlos adecuadamente y registrarlos asociados a la correspondiente transacción, indicando la vigencia y descripciones pertinentes de cada documento. Hemos visto el proceso muchas veces expresado e implementado en estos términos. Pero allí está el problema,  es correcto el proceso en su resultado, pero diseñada así, la carga de información es sumamente ineficiente, innecesariamente complicada y por ello resulta demasiado costosa.

Lo que ocurre es que diseño del proceso de digitalización sigue demasiado cerca al proceso manual previo. Por ello es demasiado lento, contiene demasiados pasos, resulta complicado de implementar en todas las oficinas, requiere de funcionarios formados en cada sitio donde se procese el trámite y el proceso digital se afecta por los tiempos de respuesta de la operación en una red nacional o internacional. ¿Cuáles son las mejoras de primer orden que habría que hacer?

Pues hay que tener un proceso de captura digital que pueda ejecutarse en forma más liviana y que tenga la menor cantidad de exigencias técnicas hacia el personal que la realiza. Como lo explicamos en el primer semestre de este año (Ver por ejemplo: La línea de producción de bits o El registro de metadatos en un proyecto de digitalización de volumen), 10 minutos más en el procesamiento de un cierto trámite de digitalización puede no sonar mucho tiempo, pero cuando estos diez minutos deben realizarse centenares o miles de veces, se tienen muchas horas que finalmente representan retrasos y costos en un proyecto masivo y dificultades en un proceso de múltiples localidades.

Con esto en mente comentaremos ideas alternativas de diseño de la carga digital de documentos en un siguiente post.