Nota a esta edición digital

Patata — Solanum tuberosum. Lámina

La Biblioteca Virtual de la Ciencia y la Técnica en la Empresa Americana, al igual que la anterior Biblioteca Virtual de la Antigua Escuela de Traductores de Toledo, es un nuevo proyecto de la Fundación Ignacio Larramendi que se ha llevado a cabo, utilizando la tecnología actual y la más reciente codificación de la información. En un entorno biblioteconómico esto significa el uso del formato MARC 21 en su última actualización de abril de 2014, así como los Resource Description and Access (RDA), cuya documentación actualiza el Joint Steering Committee for development of RDA.

Se ha utilizado, como es natural, la tecnología Linked Open Data (LOD), en la forma en que se concreta en el Europeana Data Model (EDM). El repositorio MARC de la Biblioteca Virtual de Polígrafos genera automáticamente descripciones RDF según las últimas versiones, la 5.2.4 y la 5.2.5. El modelo EDM tiene una gran influencia en la manera de llevar a cabo esta nueva Biblioteca Virtual, que como todas las demás se ha implementado con el software DIGIBIB, ya en su versión 9, producido y desarrollado por DIGIBÍS. Cabe mencionar que durante el periodo de preparación de los registros bibliográficos y de los objetos digitales la Agencia Española de Cooperación Internacional para el Desarrollo (AECID), entre otras instituciones, ha empezado a utilizar este mismo software para su biblioteca digital.

Uno de los caso de estudio de EDM presenta justamente una de las bibliotecas realizadas con el software DIGIBIB, lo que da una idea clara de la adecuación de la Biblioteca Virtual Ignacio Larramendi de Polígrafos al proyecto europeo y, por extensión, al americano. Como se sabe, la Digital Public Library of America (DPLA) también utiliza este namespace, lo que ha facilitado la realización, por parte de DIGIBÍS, de una app que permite la búsqueda conjunta en Europeana y en la DPLA. Además, la versión 5.2.5. de EDM añade dos nuevos elementos de RDA a los 7 ya incluidos en anteriores versiones.

Es importante señalar que en esta biblioteca, como en las anteriores preparadas por la Fundación Ignacio Larramendi, y en general en todas las implementadas con DIGIBIB, la información que se codifica en los campos 37X del formato MARC 21 se convierte automáticamente a los elementos del namespace RDA asumidos por EDM. Para la Biblioteca Virtual de Polígrafos es fundamental el uso sistemático de estos campos para vertebrar las relaciones entre los autores.

Una información más amplia puede leerse en el articulo Data Aggregation and Dissemination of Authority Records through Linked Open Data in a European Context, de Xavier Agenjo, Francisca Hernández y Andrés Viedma, publicado en el Cataloging & Classification Quarterly, Volumen 50, no. 8, 2012.

Los autores: la persona y el nombre de la persona.

Uno de los aspectos esenciales de la Bibliotecas Virtuales de Polígrafos es el especial tratamiento de los registros de autoridades conforme a las nuevas reglas de catalogación Resource Description and Access (RDA). La labor fundamental consiste no solo en establecer un encabezamiento preferido para un autor, en nuestro caso traductor/comentarista, sino también en proporcionar la mayor cantidad de datos posibles sobre su biografía y su contexto histórico y cultural. Todo ello proporciona una enorme unidad y exhaustividad a los registros y a la base de datos.

En esta Biblioteca, a diferencia de la Biblioteca Virtual de la Antigua Escuela de Traductores de Toledo, los autores son los creadores de las obras recogidas y no los traductores o comentaristas de ellas. Las fichas, prácticamente enciclopédicas, que se han realizado sobre estos autores, a los que denominamos polígrafos, presentan numerosos enlaces a recursos de bibliotecas que ya se han adaptado a RDA y a EDM/LOD, gracias a la granularidad del formato MARC21 y a su maleabilidad para adaptarse a las nuevas normativas y estándares.

Una de las fuentes LOD que se utilizan sistemáticamente es el VIAF (por sus siglas en ingles, Virtual International Authority File), es decir, el fichero internacional virtual de nombres autorizados y de sus variantes —importantísimas en una biblioteca como esta.

Así, cada autor está identificado por una dirección en la web que tiene unas características técnicas especiales (un URI), y está vinculado con la base de datos de VIAF. De esta manera, el usuario puede navegar pinchando en los enlaces correspondientes a los diferentes recursos de información que VIAF reúne, obteniendo una información con frecuencia riquísima como, por ejemplo, coautores, línea del tiempo, obras escritas, obras atribuidas, etc.

También se ha utilizado de forma sistemática la DBpedia, es decir la estructuración semántica de la Wikipedia, que permite una navegación riquísima por todo tipo de conceptos. Véase, por ejemplo, fray Bernardino de Sahagún. Otras fuentes utilizadas para enriquecer la información son el Linked Data Service Authorities and Vocabularies de la Library of Congress, el Faceted Application of Subject Terminology (FAST) de la OCLC, el Gemeinsame Normdatei de la Deutsche Nationalbibliothek, el catálogo de la Bibliothèque Nationale de France , y el fichero de autoridades de la Biblioteca Nacional de España (BNE).

Una de las peculiaridades basadas en los datos que se utilizan es la de la generación de líneas del tiempo y localizaciones geográficas, como ya se hace con el software DIGIMUS, también de DIGIBÍS. En el momento de redactar esta nota esta funcionalidad no está implementada aún en esta biblioteca virtual.

Navegación por conceptos vinculados a otros conceptos

Aunque pueda parecer redundante, el uso de todas estas fuentes no siempre lo es y se ha preferido pecar por exceso que por defecto. Así, por ejemplo, el fichero de la BNE y del VIAF no siempre se encuentran a nivel y se da el caso de que un autor recogido en el VIAF no se encuentre en la BNE y viceversa. Además el VIAF siempre permite a través de la entrada acerca de acceder a WorldCat Identities y encontrar una información realmente amplia, como por ejemplo ocurre con Carlos Sigüenza y Góngora.

Todos los encabezamientos de materia permiten una navegación entre conceptos gracias a la integración de la Lista de Encabezamientos de Materia que ha publicado la Subdirección General de Coordinación Bibliotecaria del Ministerio de Educación, Cultura y Deporte en SKOS (una representación de los sistemas de organización del conocimiento que es una recomendación del W3C) y que a su vez están vinculados con la Lista de encabezamentos de materia en galego (LEMAG) y con la Llista de encapçalaments de matèria de la Biblioteca de Catalunya (LEMAC). Se da, además, la circunstancia de que estos registros SKOS están vinculados con otras listas de encabezamientos de materia, como son las ya mencionadas de la Library of Congress Subject Headings (LCSH), del Répertoire d'autorité-matière encyclopédique et alphabétique unifié (RAMEAU) o del Gemeinsame Normdatei.

Como se puede ver, en las fichas de los polígrafos se ha intentado dar la máxima información posible sobre ellos y se ha cuidado muy especialmente su vinculación con entornos de datos abiertos como los ya expuestos. Hay que añadir que en el apartado "Más información" de esas fichas se incluye un enlace a la Wikipedia y que a cada una de ellas se puede acceder también desde la propia Wikipedia —utilizando la metodología Wikipedian in Residence. Así, consideramos que la catalogación de un autor o polígrafo está terminada cuando se añade un vínculo a su ficha en el apartaddo "Enlaces externos" de la entrada correspondiente de la Wikipedia. Puede verse un ejemoplo de lo que decimos en la ficha de Bernardino de Sahagún en nuestra Biblioteca Virtual y en la Wikipedia.

En definitiva, la navegación nos puede llevar a datos situados en toda la Web: a partir de una consulta a la base de datos, el usuario se puede mover por toda la Web, guiándose por los vínculos establecidos con los datasets creados y mantenidos por prestigiosas y potentes instituciones internacionales como las que se han citado.

La API de Europeana

Logo de Europeana y logo de DIGIBÍSUno de los mayores aciertos del proyecto Europeana ha sido la creación de una API que permite consultar desde cualquier aplicación que la instale toda la base de datos de Europeana. Gracias a DIGIBÍS, la Fundación Ignacio Larramendi dispone de esta API en su Biblioteca Virtual de Polígrafos.

De esta manera, si consultamos a un autor o buscamos una de sus obras en nuestra Biblioteca obtendremos, casi instantáneamente, un número considerablemente superior de hallazgos puesto que la consulta se realiza a la vez en el catálogo de nuestra biblioteca y en Europeana. Como Europeana va incrementando sus fondos, el número de resultados será cada vez mayor.

Partiendo del hecho de que, gracias al Data Exchange Agreement (DEA), es posible reutilizarlos metadatos de los objetos digitales accesibles en Europeana a través de su API, DIGIBÍS ha desarrollado para su programa de gestión bibliotecaria, DIGIBIB, un potente recolector, DIGIHUB, que permite que los registros localizados en Europeana puedan descargarse en un fichero de trabajo y, tras ser mejorados bibliográficamente, incorporarlos a cualquier otra base de datos.

Este riguroso proceso conlleva un gran esfuerzo proporciona una enorme riqueza informativa, muy úitl para el usuario. Más difícil resulta la correcta identificación de las obras, a causa de los frecuentes errores que se observan en la asignación de títulos uniformes e incluso en la transcripción de los títulos propiamente dichos, en los metadatos que las distintas instituciones proporcionan. Si los encabezamientos ya son de por sí complejos, los títulos lo son muchísimo más, por lo que es necesario llevar a cabo una enorme labor de investigación para poder unificar catalográficamente los registros.

Se han incorporado nada menos que 612 obras de 25 autores en esta nueva biblioteca virtual el encabezamiento principal está codificado con un campo 1XX del formato MARC 21 y con unos campos 3XX para añadir contenido semántico y agrupar a los autores en distintas categorías. Este  enriquecimiento se ha realizado, entre otros, con el Fichero Virtual Internacional de Autoridades (VIAF).

Dibujo que indica las distintas denominaciones por países de un autor. En este caso, Gerardo de CremonaUna labor, verdaderamente, costosa y minuciosa que exige una vasta cultura, una extensa y especializada formación profesional y además tener acceso a la consulta de una exhaustiva bibliografía que habitualmente no está en línea.

Probablemente ningún investigador del periodo de la transmisión de la ciencia de la empresa americana habrá dispuesto nunca, como va disponer ahora, de las propias obras mediante la Biblioteca Virtual de la Ciencia y la Técnica en la Empresa Americana.

La Digital Public Library of America (DPLA)

Logo de la DPLADesde el 18 de abril de 2013 está operativa la Digital Public Library of America. Es importante señalar que la DPLA va a suministrar una gran cantidad de información digital y raro será que, dada la importancia de los participantes en el proyecto, no se convierta, al igual que Europeana, en una fuente importantísima de información bibliográfica, archivística o museológica.

Es pronto para decirlo, pero es más que seguro que la DPLA proporcionará importantes fondos digitalizados que ayudarán a incrementar los recursos digitales de la Biblioteca Virtual de la Ciencia y la Técnica en la Empresa Americana. A lo largo de los años las bibliotecas, archivos y museos americanos, y sobre todo los grandes magnates americanos, han adquirido en Europa y en España magníficas piezas bibliográficas que finalmente han ido a parar a alguna institución que probablemente haya procedido en algún momento a su digitalización.

Nunca debe olvidarse que la primera edición de La Celestina está en una institución norteamericana ni cuáles fueron las razones por las que esa institución dispone de ese ejemplar único. Si eso ocurrió con la edición príncipe de la comedia de Calisto y Melibea, es probable que también habrá ocurrido con manuscritos vinculados a la Ciencia y la Técnica en la Empresa Americana, con ediciones príncipe, con segundas ediciones o reimpresiones de esas traducciones que tanta difusión habrían de tener en Europa. Es seguro que eso va ser así y por eso es tan importante la DPLA, porque nos va a permitir buscar en un solo sitio, en un solo punto de consulta, la información distribuida en multitud de instituciones.

El respaldo que ha supuesto para Europeana el que la DPLA haya adoptado el Europeana Data Model (EDM) como su modelo de datos en Linked Open Data (LOD) —puede consultarse en el Metadata Application Profile— es importantísimo. No es el objeto de esta introducción valorar la importancia que para Europeana ha tenido esa decisión, pero sí lo es dejar constancia que gracias a ello va a ser posible acceder a nuevos contenidos.

Pantallazo de la app que DIGIBÍS ha creado para consultar simultáneamente en la DPLA y en EuropeanaJustamente, la similitud de ambas estructuras de datos ha permitido que, de forma pionera, DIGIBÍS haya desarrollado una aplicación que permite consultar simultáneamente esas dos inmensas bases de datos. Mediante una sola búsqueda se obtienen resultados en Europeana y en la DPLA en una misma pantalla. La aplicación la ofrece la DPLA en su página Apps Library.

Visibilidad y normalización

Uno de los propósitos que guía la elaboración de estas Bibliotecas Virtuales es dar la mayor visibilidad a los documentos —ya sean impresos o manuscritos, mapas o fotografías— y al pensamiento hispánico a lo largo de 2000 años. De nada sirve digitalizar los materiales bibliográficos si después se almacenan en un repositorio completamente desconectado de la Web o en una unidad suplementaria de memoria.

Para lograr la mayor visibilidad posible los objetos digitales se codifican conforme a un amplio conjunto de metadatos normalizados. La experiencia del director de Proyectos de la Fundación Ignacio Larramendi como responsable delCatálogo Colectivo del Patrimonio Bibliográfico, de la informatización de la Biblioteca Nacional, con su sistema Ariadna, o de muchos otros proyectos de esta institución, ha definido claramente una línea de trabajo centrada en la normalización. Las Bibliotecas Virtuales FHL han seguido la misma estela. Este principio de buscar la visibilidad apoyándose en la normalización ha sido una norma en la interactuación entre la Fundación Ignacio Larramendi y la empresa DIGIBÍS, propiedad de la Fundación.

Logo de DIGIBIBAsí muchas de las especificaciones que se han elaborado para desarrollar el soporte lógico de las Bibliotecas Virtuales FHL han formado parte del desarrollo del Sistemas de Gestión Bibliotecaria DIGIBIB o de Gestión Archivística DIGIARCH y, viceversa, los desarrollos de esos dos sistemas o de otros en camino, beneficiarán indudablemente a las Bibliotecas Virtuales FHL, como así ha ocurrido en el caso concreto de la Biblioteca Virtual de la Antigua Escuela de Traductores de Toledo.

Logo del W3CDesde la Agenda de Lisboa ya era conocida la iniciativa sobre bibliotecas digitales, pero fue la creación de Europeana y su incorporación a la Agenda Digital para Europa lo que proporcionó a la gran biblioteca digital europea su respaldo jurídico. Europeana ha ido elaborando sus especificaciones funcionales, su modelo de datos y su propio entorno normativo en coordinación con el W3C Library Linked Data Incubator Group (W3C LLD). El informe final de este grupo de trabajo internacional se basó en el análisis de una serie de casos de estudio entre los cuales figuraba la Biblioteca Virtual Ignacio Larramendi de Polígrafos con el nombre en inglés de Polymath Virtual Library. Las Bibliotecas Virtuales FHL han procurado desde el primer momento ceñirse al modelo de datos de Europeana, el EDM.

A medida que el Europeana Data Model evoluciona se ha ido implementando en nuestras bibliotecas virtuales. De hecho, la última especificación de EDM la 5.2.5 corresponde a mayo de 2014, justamente cuando terminamos el proyecto de la Biblioteca Virtual de la Ciencia y la Técnica en la Empresa Americana.

Ya se ha mencionado antes que la Biblioteca Virtual de Francisco Sánchez, el Escéptico es uno de los casos de uso de EDM para bibliotecas y por lo tanto no tiene nada de particular continuar ajustándose a ello. Sin embargo, y basado en una larga experiencia, se optó por mantener el formato MARC 21 como columna vertebral de la aplicación y transformar estos registros a ECM mediante un proceso de mapeo automático.

La dura experiencia del autor de esta introducción, que a mediados de la década de los 80 tuvo que aprender a crear registros MARC de intercambio sin especificaciones, ha sido definitiva para orientar el proyecto hacia la normalización y para que las transformaciones entre modelos de datos las realice el software de forma transparente para el usuario. Por ello, la introducción de datos de las Bibliotecas Virtuales FHL está diseñada para una catalogación completa que posteriormente podrá generar registros en ISO 2709, pero también en EDM.

Logo de RDAAl mismo tiempo, se han ido incorporando los nuevos campos del formato MARC 21 para adaptarse a las reglas de catalogación RDA. Creemos que lo más importante, o con más futuro, ha sido introducir los campos necesarios para generar vínculos a los vocabularios de valores o conjuntos de datos (datasets) recomendados por el W3C LLD y por Europeana. Estas recomendaciones han supuesto una valiosísima guía a la hora de diseñar el modelo de relaciones de la Biblioteca Virtual de la Antigua Escuela de Traductores de Toledo, sin ellas es muy posible que se hubieran dado muchos palos de ciego.

No se trata aquí de dar una explicación completa de cuál ha sido el uso de las RDA y del formato Marc 21/RDA, pues eso ya se hizo en una comunicación presentada al congreso de la IFLA en Puerto Rico y, un año más tarde, de forma paralela al avance de los proyectos de las Bibliotecas Virtuales FHL, en el trabajo ya mencionado que se publicó en “Cataloging & Classification Quarterly”. 

Es evidente que la disponibilidad de datos en Linked Open Data tiene que dar lugar a nuevas y más potentes funcionalidades para una consulta más humana de estos datos, ya que la descarga de vocabularios o datasets o su consulta mediante SPARQL no puede tildarse de amigable.

El fichero de autoridades y de registros bibliográficos de la Polymath Virtual Library está registrado en The Data Hub y es uno de los pocos casos recogidos en el citado recurso. Ni que decir tiene que estos registros, como todos los que creados a partir de las aplicaciones de DIGIBÍS y en particular en la aplicación DIGIBIB 9, sobre el que están construidos, generan dinámicamente y de forma transparente dos repositorios OAI-PMH, uno para registros de autoridades y otro para registros bibliográficos y, al mismo tiempo, proporciona registros en EDM lo cual proporciona una amplia visibilidad en toda la Web que es el objetivo primordial de las Bibliotecas Virtuales FHL.

Otras novedades

Puede darse el caso de que al acceder en esta biblioteca a las obras digitalizadas de un autor nos encontremos con un número reducido de ellas. Este número se podrá ver incrementado automáticamente gracias a la API de Europeana, que hemos implementado en todas nuestras bibliotecas virtuales. Cuando se redactan estas líneas Europeana posee ya más de 33 millones de obras digitalizadas y su número no para de crecer.

También en esta Biblioteca Virtual hemos añadido la posibilidad de buscar por la fecha de un recurso electrónico y por la fecha del recurso original. En ocasiones no habrá fechas de digitalización en las fichas bibliográficas, lo que ocurrirá cuando no las proporcione el proveedor de datos (cualquier biblioteca o archivo) a Europeana. En estos casos aparecerá en su lugar un texto: [Fecha de publicación no identificada]. En cualquier caso, siempre que ha sido posible, se ha identificado la fecha de creación del recurso electrónico. Igualmente, si se dispone de la fecha del original, ésta aparece en la ficha bibliográfica correspondiente en el apartado "Notas", donde se podrá leer, además, una breve descripción y análisis bibliográfico del material original digitalizado.

Europeana es la fuente de la que obtenemos los registros que ofrecemos, revisados y recatalogados, en esta Biblioteca Virtual de la Ciencia y la Técnica en la Empresa Americana y que se enriquecen sensiblemente por medio de los vínculos a otros recursos bibliográficos en la Web.