viernes, 10 de octubre de 2014

Retrasos por download de documentos digitalizados


En muchos sitios cotidianamente se requiere descargar grandes archivos PDF
para buscar información que reside en las primeras o las últimas páginas.
En ese caso, hay que obtimizar los procesos para hacerlos eficientes
Hoy día es muy típico que al digitalizar documentos que originalmente estaban en papel, se almacenen las imágenes como archivos PDF en el servidor. Por sus características, el formato PDF es muy útil para manejar la imagen de lo que se obtendrá al imprimir un documento que nació en forma digital, así como las imágenes facsimilares de documentos que inicialmente estaban en papel y que se crearon a través de un proceso de digitalización. En este segundo caso, cada página del archivo, aunque luzca como texto, es en realidad una imagen. Ésta es la razón por la que un archivo PDF de 50 páginas que nació digital ocupa relativamente poco espacio, mientras que otro, de las mismas 50 páginas, pero que se creó como resultado de una digitalización de las correspondientes páginas de papel, ocupa mucho más espacio de memoria. El gran tamaño de los archivos digitalizados puede significar, en ocasiones, esperas  y retrasos debido a lo pesado que resulta su trasmisión. Comentaremos a continuación cómo ganar en eficiencia y evitar estos retrasos.

El tamaño (medido en  MBytes) de un archivo importa cuando hay que trasmitirlo desde el computador con el que trabajamos al servidor (proceso que se llama subida, carga o upload) o cuando se requiere en el computador donde trabajamos procedente desde el servidor (proceso que se llama descarga, bajada o download). Archivos de varios megabytes pueden resultar lentos cuando las conexiones a la red no son tan rápidas.

En días pasados describimos lo que puede hacerse para evitar los retrasos por upload, básicamente, haciendo la subida de los archivos digitalizados en forma automática y asíncrona (Ver Retrasos de Upload en proyectos de digitalización).

Los problemas de la descarga son diferentes. La mayor parte de las veces no queremos tener en el computador con el que trabajamos los archivos que residen en el servidor, sino garantizar la disponibilidad de la información cuando la necesitemos. Por ejemplo, un acta constitutiva de una cierta organización puede ser un documento pesado de unas sesenta páginas, pero en realidad lo que muchas veces interesa es poder hojear rápidamente el documento para tomar los datos claves en ciertas páginas, lo que pueda que ocurra al principio o al final del mismo. Si este es el caso, la mejor manera de trabajar con el archivo digitalizado es descargar las páginas individualmente, para rápidamente tener la información que queremos y no descargar todas las páginas para luego usar sólo una o dos. Esto se logra fácilmente cuando se usan plataformas de servicio que contemplan esta función.

Es esta la razón por la cual las herramientas de correo modernas, las plataformas de gestión de información y algunas otras herramientas contemplan la posibilidad de usar este tipo de descargas por páginas en lugar de archivos completos: así se evitan los retrasos por download.

Una vez más  hay que tener en cuenta que cuando se trata de una operación puntual, esporádica, puede no ser crítico el tiempo de espera o de retraso, pero si se trata de procesos cotidianos, institucionales, el ganar en eficiencia evitando los retrasos por download es importante. Para un trabajador que lo tiene que hacer muchas veces al día, descargar archivos de muchas decenas de páginas para luego usar una o dos es fastidioso e ineficiente.

No hay comentarios: