viernes, 28 de octubre de 2011

El Libro del Oso Polar: Un clásico de la Arquitectura de Información

La semana pasada comenzamos en este blog a hacer un abordaje sobre el concepto de Arquitectura de Información (AI). Pero es muy difícil comentar con cierta profundidad sobre este importante tema sin hacer alusión al “Libro del Oso Polar”, que no tiene nada que ver con ningún oso, ni con la ecología del ártico y que en realidad se llama “Information Architecture for the World Wide Web”, pero como cayó en una colección de O’Reilly que coloca un animal en peligro de extinción en cada portada y a éste le tocó un oso polar muy llamativo y característico, el libro comenzó a ser llamado y reconocido en la calle, cariñosamente, como “El Libro del Oso Polar”. Este fue el primer título que se nos ocurrió para este post, pero por el temor de confundir a los que no conocieran la historia, le agregamos el subtítulo: “Un clásico de la Arquitectura de Información” a este comentario que parte desde él.

Los autores son Louis Rosenfeld y Peter Morville, que lo publicaron en el año 1.998. Ambos autores son bibliotecólogos brillantes. Estos dos aspectos, su inteligencia analítica y su formación bibliotecológica, se siente en toda su particular aproximación al tema de la AI. El Libro del Oso Polar, por su parte tuvo la virtud de darle un contexto a la AI en un momento clave de su desarrollo como transdisciplina y de la World Wide Web como fenómeno mundial.

Para los autores, la AI puede definirse como “la combinación de organización, etiquetado y esquemas de navegación en un sistema de información” o bien como “el diseño estructural de un espacio de información para facilitar la completitud de la tarea y el acceso al contenido”.

La definición que comentamos la semana pasada (ver) coincide en muchos aspectos con la de este libro en el que sus autores señalan que la AI es: “El arte y la ciencia de estructurar y clasificar sitios web e intranets para ayudar a la gente a encontrar y manejar información”. En cuanto a su carácter y actualidad Rosenfeld y Morville señalan que la AI es “una disciplina emergente y una comunidad de prácticas enfocada en traer los principios del diseño y la arquitectura al terreno digital”.

Podemos ver que la noción de AI de Rosenfeld y Morville es muy coincidente con la idea de que en la AI es un tema de actualidad, donde es claro que las aplicaciones que se han estado construyendo luego de la WWW han puesto en evidencia que la existencia de ingentes recursos de información y de poderosos sistemas de procesamiento exigen una reflexión cualitativa acerca de qué es lo que hace que la información sea encontrable (porque no siempre lo es) y qué se requiere para que una vez que se encuentra sea posible manejarla adecuadamente como un bien útil (porque no siempre esto resulta sencillo de realizar).

La experiencia muestra que no es suficiente el acceso a la información. La Internet ha popularizado (como ya señalaba en su momento el Libro del Oso Polar, hoy un clásico en AI) el acceso de innumerables recursos de información donde hay información acerca de casi cualquier tema, pero cómo se logra que el usuario necesitado, que sabe además que lo que busca existe, pueda llegar, es el conocimiento esencial para construir servicios de información que sean realmente útiles.

Indudablemente que hay un tema de organización y estructura de información, pero no desde el punto de vista del dato, que es la clásica aproximación de los computistas e informáticos, sino de la capa superior donde yacen los objetos de información que manipulamos en el contexto de cada aplicación.

En la aproximación tradicional los profesionales del software nos ayudaban a pasar del dato a las aplicaciones, pero lo que se ha mostrado en la era Web es que en el medio del dominio del dato y del dominio de las aplicaciones hay un universo de reglas de información que subyacen debajo de las aplicaciones pero arriba de los datos. Precisamente la AI ayuda a entender lo que pertenece a esta capa intermedia, el dominio de la información, una abstracción necesaria que mantiene bastante independencia de la tecnología y que trataremos de ir desenredando y exponiendo en nuestros próximos posts.

viernes, 21 de octubre de 2011

Arquitectura de Información

Página inicial del Instituto de Arquitectura de Información,
www.iainstitute.org 

Uno de los conceptos más interesantes sobre los que continuamente volvemos, sobre el que tenemos que responder preguntas y sobre el que somos invitados a exponer en seminarios, talleres, congresos y múltiples formas de conversaciones, es el de Arquitectura de Información (AI). De alguna forma todos los asuntos que se han venido entrecruzando en este blog son temas de Arquitectura de Información. Pero ¿qué es la Arquitectura de Información? ¿Cómo podemos definirla? Dedicaremos este post al tema comentando la definición de Instituto de Arquitectura de Información y más adelante, seguramente, otros, aportando puntos de vista y conceptos complementarios.

Para el Instituto de Arquitectura de Información, una entidad internacional que se dedica a su estudio (www.iainstitute.org), la AI consiste en “el arte y la ciencia de organizar y rotular sitios web, intranets, comunidades en línea y software para promover la usabilidad y la encontrabilidad”. Allí se señala que “a medida que la información prolifera exponencialmente, la usabilidad se convierte en un factor crítico de éxito para sitios webs y aplicaciones de software”.

Esta definición es muy interesante porque señala el cruce metodológico de arte y ciencia en que se desenvuelve la Arquitectura de Información. Se toca el tema de sus fines: la usabilidad y la encontrabilidad de la información. Lamentablemente estas son dos palabras complicadas, particularmente en español, por lo que estamos obligados a comentarlas ya que, sin duda, corresponden a dos puntos importantes:

El primero tiene que ver con el hecho de que la información puede ser muy útil, pero no siempre lo es. No siempre está en un formato, que en términos prácticos, nos permite usarla para lo que la necesitamos. No se trata aquí de si es incompleta o no, correcta o no. Estas son otras propiedades. Se trata de que aún siendo correcta y completa la información puede ser más o menos útil por la forma en que se encuentra disponible. Observamos en nuestra experiencia que un contenedor de información puede caracterizarse porque proporciona la información con mucha o poca “usabilidad”.

El segundo concepto aludido arriba tiene que ver con el hecho de que la información no siempre se encuentra. Incluso muchas veces está, pasamos sobre ella, al lado de ella, debajo de ella, pero no la localizamos, no la vemos, no la tropezamos claramente. Sin duda, en esta era de la industrialización de la información, de la sociedad de la información, paradójicamente, una de las propiedades de ésta que no siempre se logra desarrollar es la capacidad de ser es “encontrable”.

La definición de AI que comentamos hoy alude también a otro aspecto que merece la pena observar y es que ésta (la AI) tiene que ver con estructura (organización) de la información y con la manera como la identificamos (rotulación). En efecto, para que la información sea usable y encontrable es crucial el cómo la diseñamos y cómo la clasificamos y de allí cómo la mencionamos para fines internos o externos, de comunicación con otros.
Finalmente, la definición del IAInstitute menciona conceptos vinculados con la tecnología, la Web, la intranet, las comunidades en línea, el software. Es claro que el especialista en AI tiene que lidiar con estos conceptos, aunque no por ello tenga que se un especialista en ninguno de ellos o en la tecnología.

La AI es un tema moderno, caliente, sobre el que se produce mucho actualmente. Sin duda, necesitaremos volver varias veces sobre él, ya que es un tema crucial para nuestros lectores, muchos de ellos especialistas en información con una cierta vocación o de atracción por la Arquitectura de información.

viernes, 14 de octubre de 2011

Más sobre el PDF: tipo de formato, contenido y futuro

¿Hasta dónde es bueno usar el formato PDF?
¿Hasta donde será bueno? ¿Qué depara el furturo al PDF?
Son algunas preguntas que muchos se hacen
Hemos estado conversando acerca de los distintos formatos presentes en la Web y en las últimas dos semanas, en post llamados “Errores frecuentes en el uso del PDF” y “Lo bueno lo bonito y lo feo del formato PDF”, presentamos los aportes de este formato, como un mecanismo para mostrar lo que se va a imprimir y sus limitaciones cuando se abusa de él y se lo usa como una solución de navegación y de presentación de contenidos en un sitio Web. Por el interés que despertaron estos últimos post escribimos este tercer post sobre el PDF, ampliando la información acerca del formato y respondiendo a algunas de las preguntas que nos han hecho nuestros lectores, como por ejemplo, si se trata de un estándar abierto y recomendable o algo que cierra y restringe a favor de Adobe Systems, la compañía que lo creó. ¿Qué es lo que contiene un archivo formato PDF? y, finalmente, una reflexión acerca del futuro del PDF.

¿Estándar abierto o formato propietario?
El PDF es un formato estándar. Como formato de archivo fue creado en 1993 por Adobe System y en efecto, muchas gente se hace preguntas acerca de su uso como estándar, porque fue un formato propietario. Su origen está en un sistema llamado “Camelot” creado por John Warnock, uno de los fundadores de Adobe.

Desde el 2001 la especificación fue disponible en forma gratuita. Esto no significaba que el formato fuese exactamente un estándar abierto, ya que, en ese momento, el control del formato seguía siendo de Adobe. A partir del 2008 la historia es diferente porque, con la autorización de Adobe, la International Organization for Standardization (ISO) lo publicó con el código ISO 32000-1:2008. Los derechos de uso son ahora libres de regalías para todas las patentes relacionadas con el PDF que poseía Adobe System. Esto quiere decir que cualquier persona y organización puede usar, hacer, vender o distribuir sistemas, herramientas, soluciones o contenidos implementados con este formato.

¿Qué contiene un archivo PDF?
Cada archivo PDF es una descripción bastante precisa de la representación de un documento con una diagramación fija. La especificación abarca la definición del texto, la tipografía (fonts), imágenes o fotografías, resolución gráfica y todos los elementos que en principio deben estar definidos para especificar, sin ambigüedades, cómo el documento debe verse. Puede notarse que por eso es muy diferente la representación HTML (que tiene mucha más flexibilidad y ambigüedad) a la representación PDF de un documento.

Esta descripción precisa de la diagramación y otros elementos de la presentación es lo que hace al PDF apropiado para definir la impresión de un contenido e inapropiado como mecanismo de consulta rápida y presentación universal de ese mismo contenido en cualquier medio (Ver nuestro post “Lo bueno, lo bonito y lo feo del formato PDF”).

La especificación del PDF incluye la representación en lenguaje PostScript del diseño del documento, el encapsulado de los fonts que se requieren para presentarlo y una organización de lo requerido para que todos los componentes estén contenidos en un único archivo.

El futuro del PDF
Muchas veces nos preguntan acerca del futuro del PDF y de los documentos grabados en este formato, que cada vez son más. Afortunadamente el formato está lo bastante bien definido y bien difundido como para esperar que en el futuro va a seguir siendo posible ver los documentos grabados hoy en formato PDF.

Sin embargo, con el tiempo, es probable que el PDF deje de usarse como mecanismo de preservación de documentos imprimibles y que su uso de paso a otros esquemas que aprovechen la separación y articulación de contenidos que facilita el XML para hacer gráficas manipulables, vistas dinámicas, anotaciones enlazadas y marcas semánticas. La transición a este futuro ha sido y seguirá siendo un poco lenta debido a que, como señala Ginsparg en un artículo que citamos hace unas semanas (ver), existe la necesidad comprensible de mantener estables archivos previos, como lo hizo el papel por centenares de años.

viernes, 7 de octubre de 2011

Errores frecuentes en el uso del PDF

Un error, lamentablemente frecuente en la Web, es obligar al usuario a
navegar a través de contenidos en PDF presentados con una fachada HTML 

La semana pasada, en nuestro post “Lo bueno, lo malo y lo feo del formato PDF” estuvimos comentando de los aciertos del uso del formato PDF para representar documentos que se van a imprimir. También comentamos lo desatinado que resulta usar el PDF, consciente o inconscientemente, como un sustituto del HTML, un lenguaje más adecuado para la representación de contenidos navegables en diversos tipos de dispositivos. Algunas personas nos pidieron ampliar un poco esta explicación, particularmente ilustrando los errores frecuentes. Esto es definitivamente importante para Gerentes de información y responsables de revistas electrónicas, un tipo de aplicación donde normalmente el PDF siempre se requiere pero donde, desafortunadamente, se cometen, en muchas implementaciones, errores de Arquitectura de información.

Pecados, pero no pecadores
Atendiendo las solicitudes recibidas explicaremos una vez más el pecado (uso inapropiado del PDF que en algunos sitios Web se hace), pero sin hacer alusión innecesaria a los pecadores. Esto es, procuraremos definir mejor los errores, con más detalles, como para que un Gerente de Información o un responsable de un servicio Web pueda identificarlos, pero sin dar una dirección específica ya que por un lado es innecesario y por otro puede resultar inconveniente ya que si los responsables del servicio cambian para bien su implementación ocasionarían que, por la dinámica de la Web, lo que era inicialmente un ejemplo terminara siendo un contra ejemplo.

Un error muy frecuente en revistas electrónicas
Una arquitectura muy difundida pero muy incómoda para los usuarios son las revistas cuya existencia en la Web toma la forma de un conjunto de artículos en formato PDF presentados con una fachada de menú HTML. Este es un esquema inapropiado, francamente incómodo para la búsqueda, la consulta rápida, la navegación, la presentación en muchos dispositivos. El caso es un ejemplo de contenidos publicados sin conocimientos de Arquitectura de Información.

En una revista electrónica, sobre todo si el origen de la misma es una revista que anteriormente se publicaba sólo en papel, el uso del PDF es casi una obligación. Los usuarios muchas veces esperan imprimir adecuadamente los diversos artículos. Sin embargo, eso no significa que los artículos sólo se publiquen como PDF. Para un lector que quiere leer algo rápidamente, por ejemplo, porque quiere explorar todo el contenido de la revista para escoger cuáles artículos leer o el orden de la lectura, es inconveniente una arquitectura donde hojear la revista implica bajarse un contenido PDF, revisarlo, volver al menú o la tabla de contenido y descargar el siguiente artículo, también en PDF, y así sucesivamente. El mecanismo obliga al lector a usar la Web en forma excesivamente artesanal.

El caso de sitios institucionales de pequeñas organizaciones
Un caso todavía más grave es cuando no se trata de una revista sino de un sitio Web institucional y la organización que se presenta a los usuarios es la de un a conjunto de archivos PDF accesibles a través de una fachada HTML. Ocurre todavía en el ámbito académico con muchas memorias de congresos y en general con los sitios Web de muchas pequeñas organizaciones. Estos sitios deben ser, cuanto antes mejor, rápidamente transformados para beneficio de sus usuarios.

La recomendación
Una vez más nuestra recomendación es la misma que expresamos la semana pasada: No estamos contra el uso del PDF, que indudablemente ha sido un aporte histórico, sino contra el mal uso del formato al sacarlo de su condiciones de utilidad y emplearlo, consciente o inconcientemente, como una alternativa al HTML.