Nota a esta edición digital

Representación de viajero científico ilustradoLa Biblioteca Virtual de Viajes Científicos Ilustrados está implementada en el programa de gestión digital DIGIBIB. Este programa, desarrollado para los propósitos de la Fundación Ignacio Larramendi, ha tenido una gran acogida en toda España porque sus funcionalidades han permitido a más de 50 instituciones de memoria publicar en la Web millones de objetos digitales. Entre ellas hay que citar diversas Reales Academias, por ejemplo la de la Historia, los proyectos nacionales del Ministerio de Educación, Cultura y Deporte como la Biblioteca Virtual Patrimonio Bibliográfico, las de la mayoría de las Comunidades Autónomas, como la Biblioteca Digital de Castilla-León o Biblioteca Dixital de Galicia, por poner algunos ejemplos. Como prescribe la Ley de Patrimonio Histórico de 1985, las Comunidades Autónomas tienen competencias exclusivas en materia de patrimonio archivístico, bibliográfico o museológico.

Este mismo programa ha sido el que ha capacitado a grandes instituciones depositarias de patrimonio bibliográfico para alcanzar una gran visibilidad en la Web y contribuir con sus registros y sus objetos digitales a Hispana y a Europeana. Todo esto ha sido posible gracias a los desarrollos informáticos de DIGIBÍS, empresa filial de la Fundación Ignacio Larramendi que también fue creada por don Ignacio Hernando de Larramendi.

Así, la Fundación Ignacio Larramendi, su Biblioteca Virtual de Polígrafos y DIGIBÍS, la empresa que da soporte a los mayores proyectos de digitalización de patrimonio cultural, han unido sus esfuerzos mediante una estrecha colaboración.

Esta Biblioteca Virtual de Viajes Científicos Ilustrados ha sido implementada en una nueva versión del programa DIGIBIB, en este caso la versión 10. Aunque cuenta con una espina dorsal muy robusta, basada en registros de autoridad y bibliográficos, un repositorio OAI-PMH que se alimenta dinámicamente de forma transparente para el catalogador, y la publicación de los datos en los formatos de la Web Semántica, ajustados a la ontología de Europeana Data Model (EDM), esta última versión dispone de nuevas funcionalidades y ha introducido muchos cambios en el diseño gráfico y la presentación de los datos..

Estas funcionalidades y diseños se han proyectado para reflejar el espíritu de la Biblioteca Virtual de Polígrafos. Este espiritu se condenso en el caso de estudio del Informe Final del Grupo Incubador de Datos Vinculados de Bibliotecas y, sobre todo, en el caso de estudio de Europeana Data Model, casos ambos que muestran cómo se teje una malla (semántica) entre autores, conceptos, registros bibliográficos, recursos digitales, fuentes de información y silos de datos, que dan ejemplo de lo que se puede conseguir con la tecnología Linked Open Data. Hay una información más amplia en el artículo Data Aggregation and Dissemination of Authority Records through Linked Open Data in a European Context . Cataloging & Classification Quarterly Vol. 50 , Iss. 8, 2012.

Reconciliación semántica (DVR)

Como se decía en la «Nota a la Edición» de la Biblioteca Virtual de la Ciencia y la Técnica en la Empresa Americana, uno de los aspectos esenciales de la Bibliotecas Virtuales de Polígrafos es el especial tratamiento de los registros de autoridades conforme a las reglas de catalogación Resource Description and Access (RDA). La labor fundamental consiste no solo en establecer un encabezamiento preferido para un autor, sino también en proporcionar la mayor cantidad de datos posibles sobre su biografía y su contexto histórico y cultural. Todo ello aporta una enorme unidad y exhaustividad a los registros y a la base de datos.

 

Reconciliación semántica con respecto a lugares

 

Pero en esta nueva Biblioteca Virtual, aunque se buscaban los mismos fines, el proceso se ha beneficiado de las técnicas y procedimientos de Data validation and reconciliation (DVR), que se suelen traducir con la expresión «reconciliación» y que han permitido automatizar −hasta cierto punto− la vinculación de las personas, no los nombres de las personas, con muchos más vocabularios de valores, lo que facilitará la navegación, e incrementará la visibilidad de la información. Los registros, prácticamente enciclopédicas, que se han realizado sobre estos autores, a los que denominamos polígrafos, presentan numerosos enlaces a recursos de bibliotecas que ya se han adaptado LOD, gracias a la granularidad del formato MARC21 y a su maleabilidad para adaptarse a las nuevas normativas y estándares.

Una de las fuentes LOD que se utilizan sistemáticamente, por su relevancia en la nube de datos Linked Open Data, es el VIAF (por sus siglas en inglés, Virtual International Authority File), es decir, el fichero internacional virtual de nombres autorizados y de sus variantes –importantísimas en una biblioteca como esta­.

Infografía de VIAF


Así, cada autor está identificado por una dirección en la web que tiene unas características técnicas especiales (un URI), y está vinculado con, entre otras, la base de datos de VIAF. De esta manera, el usuario puede navegar pinchando en los enlaces correspondientes a los diferentes recursos de información asociados, lo que completa una información con frecuencia riquísima como, por ejemplo WorldCat Identities, que ofrece una visión general de coautores, línea del tiempo de las obras, obras publicadas, obras atribuidas, etc.

También se ha utilizado de forma sistemática la DBpedia, es decir la estructuración semántica de la Wikipedia, que permite la navegación por todo tipo de conceptos. Véase, por ejemplo, Alejandro Malaspina. Otras fuentes utilizadas para enriquecer la información son el Linked Data Service Authorities and Vocabularies de la Library of Congress, el Gemeinsame Normdatei de la Deutsche Nationalbibliothek, el catálogo de la Bibliothèque Nationale de France, y el fichero de autoridades de la Biblioteca Nacional de España.

La utilización de técnicas de reconciliación ha permitido extender el número y procedencia de los vínculos y se han utilizado, siempre que ha sido posible, como fuentes básicas y comunes de información los ficheros de autoridad y la DBpedia en castellano, catalán (p.e., CANTIC), gallego, vasco y portugués, además de otras fuentes como Social Network and Archival Context (SNAC).

 

Formato ficha y formato MARC 21

A la izquierda, la información sobre el registro del polígrafo en formato RDA, a la derecha, en formato MARC 21.

Se muestran los campos de vocabularios de valores y las relaciones semánticas.

 

Una de las peculiaridades de esta Biblioteca Virtual, basada en la vinculación de datos, es la generación de una línea del tiempo georreferenciada, como ya se hace con el software DIGIMÚS, también de DIGIBÍS. Aunque estaba planificado en el momento de cerrar la Biblioteca Virtual de la Ciencia y la Técnica en la Empresa Americana, se implementa en esta nueva Biblioteca Virtual, lo cual permite una nueva forma de presentación de datos y, no hay que olvidarlo, añadirá nuevos datos a quienes reutilicen esta información.

En esta Biblioteca Virtual de Viajeros Científicos Ilustrados se han incorporado 1.018 obras y se han seleccionado un total de 23 polígrafos. El encabezamiento principal está codificado con un campo 1XX del formato MARC 21 de autoridad y con unos campos 3XX para añadir contenido semántico y agrupar a los autores en distintas categorías. Estos campos son la base para la nueva presentación gráfica de los datos, su visualización y navegación que se ha mencionado.

 

Humboldt en la línea de tiempo de la biblioteca virtual.

 

Vinculación semántica extendida

Aunque pueda parecer redundante, el uso de todas estas fuentes mencionadas no lo es. Para esta Biblioteca Virtual se han utilizado, como se ha dicho técnicas de reconciliación semántica, lo que ha permitido extender la selección de vocabularios de valores con los que establecer vínculos semánticos, hasta un total de 17 vocabularios diferentes. Esta selección se ha realizado sobre tres criterios fundamentales. En primer lugar, los vocabularios de valores y fuentes que concentran un mayor número de descripciones y que aglutinan un mayor número de fuentes, como son VIAF y Wikidata. En segundo lugar, los vocabularios de valores (o registros de autoridad) de bibliotecas y catálogos colectivos del entorno cultural de la Biblioteca Virtual de Polígafos, como por ejemplo la Biblioteca Nacional de España (BNE), la Deutsche National Bibliothek (DNB),  Bibliothèque nationale de France (BNF), la Library of Congress (LC), el Catalogue du Système Universitaire de Documentation (SUDOC) o el WorlCat. Y en tercer lugar, se han establecido vínculos con recursos en los idiomas más relacionados con los propios polígrafos como son, además del castellano, el catalán, el gallego, el portugués y el vasco. Por este motivo se ha extendido la vinculación a las DBpedias en los idiomas mencionados. Es decir, aunque pueda parecer redundante, la extensión de los vínculos semánticos tiene como objetivo fortalecer la red de relaciones del entorno cultural de la Biblioteca Virtual de Polígrafos en la Web Semántica. 

Así, por ejemplo, el fichero de la BNE y del VIAF no siempre se encuentran a nivel y se da el caso de que un autor recogido en el VIAF no se encuentre en la BNE y viceversa. Además el VIAF siempre permite a través de la entrada «acerca de» acceder a WorldCat Identities y encontrar una información realmente amplia, como por ejemplo ocurre con Celestino Mutis.

 

Ficha en formato MARC 21 de Celñestino Mutis

 

Todos los encabezamientos de materia permiten una navegación entre conceptos gracias a la integración de la Lista de Encabezamientos de Materia que ha publicado la Subdirección General de Coordinación Bibliotecaria del Ministerio de Educación, Cultura y Deporte en SKOS (una representación de los sistemas de organización del conocimiento que es una recomendación del W3C) y que a su vez están vinculados con la Lista de encabezamentos de materia en galego (LEMAG), con la Lista d'encapçalaments de matèria de la Biblioteca de Catalunya (LEMAC), y con la Lista bilingüe de encabezamientos de materia en vasco (LEMAV). Se da, además, la circunstancia de que estos registros SKOS están vinculados con otras listas de encabezamientos de materia, como son las de la Library of Congress Subject Headings (LCSH), del Répertoire d'autorité-matière encyclopédique et alphabétique unifié (RAMEAU) o del Gemeinsame Normdatei.

En los registros de los polígrafos se ha intentado dar la máxima información posible sobre ellos y se ha cuidado muy especialmente su vinculación con entornos de datos abiertos como los ya expuestos. Tomemos, por ejemplo, el registro de Jorge Juan: como se puede ver, en la columna de la derecha se detalla la siguiente información: Campo de Actividad, Filiación, Profesión / Ocupación y Lengua asociada. Todos los registros de autoridad cuentan, haciendo lo que acabamos de decir con estas técnicas de reconciliación, con los siguientes epígrafes: Enlaces externos, Apuntes biográficos / históricos, Linked Open Data, Relaciones, Enlaces recomendados, Fuentes consultadas y Nombres alternativos.

 

Ficha de autoridad de Jorge Juan

 

Esta forma de presentar la información sobre un autor, no sobre el nombre de un autor, es deudora de la filosofía archivística que busca proporcionar información de contexto para completar o, incluso, justificar las actividades, funciones o el papel de una persona, una institución o una familia en la producción de documentos, tal y como se detalla en la norma ISAAR (CPF) y su correlato, el esquema EAC-CPF, que no en vano son las siglas de Encoded Archival Context.

Hay que hacer hincapié en que en el proceso de reconciliación los registros de los autores se han enriquecido con otros datos como los lugares de nacimiento y muerte, así como se han incluido las coordenadas geográficas de los lugares de nacimiento en el campo 034 del formato MARC 21 de autoridades para registros de autoridad, extraídas de Wikidata, de DBpedia y de GeoNames, lo que combinado con las fechas de nacimiento permite componer una línea del tiempo para cada uno de los polígrafos y una línea del tiempo general.

En definitiva, la navegación nos puede llevar a datos situados en toda la Web: a partir de una consulta a la base de datos, el usuario se puede mover por toda la Web guiándose por los vínculos establecidos con los conjunto de datos (datasets) de por prestigiosas instituciones internacionales como las que se han citado.

La API de Europeana

Logo de Europeana LabsUno de los mayores aciertos del proyecto Europeana ha sido la creación de una API que permite consultar desde cualquier aplicación que la instale toda la base de datos de Europeana. Gracias a DIGIBÍS, la Fundación Ignacio Larramendi dispone de una herramienta que permite recolectar selectivamente los registros de una búsqueda realizada sobre la API de Europeana, así como realizar las mismas peticiones a través del servidor SRU de Hispana.

Partiendo del hecho de que, mediante el Data Exchange Agreement (DEA), es posible reutilizar los metadatos de los objetos digitales accesibles en Europeana a través de su API. Este riguroso proceso conlleva un gran esfuerzo que proporciona una enorme riqueza informativa, muy útil para el usuario, que implica la correcta identificación de las obras, cosa no siempre fácil, a causa de los frecuentes errores que se observan en la asignación de títulos uniformes e incluso en la trascripción de los títulos propiamente dichos que las distintas instituciones proporcionan en sus metadatos. Si los encabezamientos ya son de por sí complejos, los títulos lo son muchísimo más, por lo que es necesario llevar a cabo una enorme labor de investigación para poder unificar catalográficamente los registros.

Además, la API de Europeana se utiliza para completar los resultados de búsqueda que ofrece la Biblioteca Virtual de Polígrafos. De esta manera, si consultamos a un autor o buscamos una de sus obras en nuestra Biblioteca obtendremos, casi instantáneamente, un número considerablemente superior de hallazgos puesto que la consulta se realiza a la vez en el catálogo de nuestra biblioteca y en Europeana. Como Europeana va incrementando sus fondos, el número de resultados será cada vez mayor.

La Digital Public Library of America (DPLA)

DPLA-Europeana. Resultados de la búsqueda Jorge Juan

Desde el 18 de abril de 2013 está operativa la Digital Public Library of America. Es importante señalar que la DPLA al igual que Europeana, es una fuente importantísima de información bibliográfica, archivística o museológica.

La DPLA, a través de su API, proporciona importantes fondos digitalizados que ayudan a incrementar los recursos digitales de la Biblioteca Virtual de Viajes Científicos Ilustrados. A lo largo de los años las bibliotecas, archivos y museos americanos, y sobre todo los grandes magnates americanos, han adquirido en Europa y en España magníficas piezas bibliográficas que finalmente han ido a parar a alguna institución que probablemente haya procedido en algún momento a su digitalización.

Ya se dijo que no se debe olvidar que la primera edición de La Celestina está en una institución norteamericana, ni cuáles fueron las razones por las que esa institución dispone de ese ejemplar único. Si eso ocurrió con la edición príncipe de la comedia de Calisto y Melibea, es probable que también haya ocurrido con manuscritos vinculados a la Biblioteca Virtual de los Viajes Científicos Ilustrados, con ediciones príncipe, con segundas ediciones o reimpresiones de esas traducciones que tanta difusión hubieron de tener en Europa. Es seguro que eso va ser así y por eso es tan importante la DPLA, porque nos va a permitir buscar en un solo sitio, en un solo punto de consulta, la información distribuida en multitud de instituciones.

El hecho de que la DPLA haya adoptado el Europeana Data Model (EDM) como su modelo de datos en Linked Open Data (LOD) –puede consultarse en el Metadata Application Profile– es importantísimo. No es el objeto de esta introducción valorar la importancia que para Europeana ha tenido esa decisión, pero sí lo es dejar constancia  de que gracias a ello es posible acceder simultáneamente a 70 millones de objetos digitales de las dos orillas del Atlántico.

La Biblioteca Virtual de Viajes Científicos Ilustrados cuenta con una app desarrollada por DIGIBÍS para consultar simultáneamente en la DPLA y en Europeana. Justamente la similitud de ambas estructuras de datos ha permitido que, de forma pionera, DIGIBÍS haya creado esta aplicación de consulta simultánea en esas dos inmensas bases de datos. Mediante una sola búsqueda se obtienen resultados en Europeana y en la DPLA en una misma pantalla. La aplicación la ofrece la DPLA en su página App Library.

Conseguir la máxima visibilidad para los documentos digitalizados

Uno de los propósitos que guía la elaboración de estas Bibliotecas Virtuales es dar la mayor visibilidad a los documentos –ya sean impresos o manuscritos, mapas o fotografías– y al pensamiento hispánico a lo largo de 2000 años. De nada sirve digitalizar los materiales bibliográficos si después se almacenan en un repositorio completamente desconectado de la Web o en una unidad suplementaria de memoria.

Para lograr la mayor visibilidad posible, los objetos digitales se codifican conforme a un amplio conjunto de metadatos normalizados. La experiencia del director de Proyectos de la Fundación Ignacio Larramendi, Xavier Agenjo Bullón, como responsable del Catálogo Colectivo del Patrimonio Bibliográfico, de la informatización de la Biblioteca Nacional, con su sistema Ariadna, o de muchos otros proyectos de esta institución, ha definido claramente una línea de trabajo centrada en la normalización. La Biblioteca Virtual de Polígrafos han seguido la misma estela. Este principio de buscar la visibilidad apoyándose en la normalización ha sido una norma en la interactuación entre la Fundación Ignacio Larramendi y la empresa DIGIBÍS.

Muchas de las especificaciones que se han elaborado para desarrollar el soporte lógico de la Biblioteca Virtual de Polígrafos y sus bibliotecas temáticas y de autor han pasado a formar parte del desarrollo del Sistema de Gestión Digital Bibliotecaria DIGIBIB o del de Gestión Digital Archivística DIGIARCH y, viceversa, los desarrollos de esos dos sistemas o de otros en camino, beneficiarán indudablemente a la Biblioteca Virtual de Polígrafos

Logo del W3CDesde la Agenda de Lisboa ya era conocida la iniciativa sobre bibliotecas digitales, pero fue la creación de Europeana y su incorporación a la Agenda Digital para Europa, y al Mercado Único Digital Single Market lo que ha mantenido el respaldo jurídico y económico de la gran biblioteca digital europea. Europeana ha ido elaborando sus especificaciones funcionales, su modelo de datos y su propio entorno normativo en coordinación con el W3C Library Linked Data Incubator Group (W3C LLD). El informe final de este grupo de trabajo internacional se basó en el análisis de una serie de casos de estudio entre los cuales figura la Biblioteca Virtual de Polígrafos con el nombre en inglés de Polymath Virtual Library. La mencionada Biblioteca Virtual ha procurado desde el primer momento ceñirse al modelo de datos de Europeana, el EDM.

A medida que el Europeana Data Model (EDM) ha ido evolucionando se han incorporado las sucesivas versiones en nuestra Biblioteca Virtual de Polígrafos. De hecho, la Biblioteca Virtual de la Ciencia y la Técnica en la Empresa Americana se presentó públicamente con la que era entonces la última especificación de EDM, la 5.2.5, mientras que la Biblioteca Virtual de Viajes Científicos Ilustrados que presentamos ahora se ajusta ya a la última modificación de EDM, la versión 5.2.7 publicada en abril de 2016.

 

Descripción RDF del registro de autoridad de Jorge Juan

 

Ya en la Biblioteca Virtual de Francisco Sánchez, el Escéptico, que es el caso de uso de EDM para bibliotecas en Europeana que se ha mencionado antes, se usó este esquema, sin embargo, y basado en una larga experiencia, se optó por mantener el formato MARC 21 como columna vertebral de la aplicación y transformar estos registros a EDM mediante un proceso de transformación automática.

Al mismo tiempo, se han ido incorporando los campos del formato MARC 21 para adaptarse a las reglas de catalogación RDA. De todo ello, el cambio más importante y con más futuro ha sido introducir los campos necesarios para generar vínculos a los vocabularios de valores o conjuntos de datos (datasets) en Linked Open Data. En cualquier caso, BIBFRAME, la iniciativa de la Library of Congress y otras bibliotecas de todo el mundo para desarrollar un modelo de datos que remplace a medio plazo al formato MARC 21 se ha tenido muy en cuenta en el análisis funcional de esta Biblioteca Virtual.

Es evidente que la disponibilidad de datos en Linked Open Data tiene que dar lugar a nuevas y más potentes funcionalidades para una consulta más humana de estos datos, ya que la descarga de vocabularios o datasets o su consulta mediante SPARQL no puede tildarse de amigable.

Ni que decir tiene que estos registros, como todos los creados a partir de las aplicaciones de DIGIBÍS y, en particular, en la aplicación DIGIBIB 10, sobre la que están construidos, generan dinámicamente y de forma transparente dos repositorios OAI-PMH, uno para registros de autoridades y otro para registros bibliográficos y, al mismo tiempo, proporciona registros en EDM 5.2.7 lo cual se traduce en una amplia visibilidad en toda la Web que es el objetivo primordial de la Biblioteca Virtual de Polígrafos.

 

Madrid, 27 de marzo de 2017

Se conmemora la muerte en 1625 de Antonio de Herrera y Tordesillas
Polígrafo incluido en la Biblioteca Virtual de la Ciencia y la Técnica en la empresa americana