Nota a esta edición digital

 

La Biblioteca Virtual de Novatores, nombre este último que se dio a un grupo de pensadores y científicos innovadores en los siglos XVII y XVIII, está implementada en el sistema de gestión digital DIGIBIB, en este caso la versión 10. El sistema de gestión digital DIGIBIB, producido por la empresa tecnológica DIGIBÍS, se ha ido desarrollando, desde la primera implementación de la Biblioteca Virtual de Andalucía (2003), de forma paralela con la que hoy en día denominamos Biblioteca Virtual de Polígrafos, proceso en el que se han producido mutuas retroalimentaciones.

La Biblioteca Virtual de Polígrafos, denominada inicialmente Biblioteca Virtual FHL, y las diversas bibliotecas temáticas y de autor que incluye han sido descritas en numerosos artículos y libros, siendo el último de ellos el redactado para la Salamanca Working Papers Series, del Max-Planck-Institut für europäische Rechtsgeschichte, que se presentó en la conferencia internacional The School of Salamanca-A Case of Global Knowledge Production?, celebrada en Buenos Aires del 24 al 26 de octubre de 2018, con el título «Visibility and Digital Accessibility of the School of Salamanca in a Linked Open-Data Environment». Este artículo, de considerable extensión, da una versión detallada del cómo y el por qué de las Bibliotecas Virtuales. El lector interesado en ello hará bien en consultarlo, pero en esta nota se intentará resumir de forma sucinta tanto la metodología del proyecto como el modelo de datos utilizado en el mismo.

Pantallazo. Salamanca Working Papers Series

La estructura de la información: los registros de autoridad

La estructura de la información de la Biblioteca Virtual de Novatores, como parte de la Biblioteca Virtual de Polígrafos, está formada por registros de autoridad, bibliográficos y de fondos y localizaciones, tal y como permite la codificación en formato MARC 21. En esta estructura, los registros de autoridad –que tienen como protagonistas a las personas, en este caso los polígrafos, y los nombres establecidos para encabezar y ser punto de acceso a una información, primero bibliográfica y segundo digital– constituyen el núcleo en torno al cual se organiza toda la información. Para la elaboración de estos registros, la Fundación Ignacio Larramendi viene utilizando, ya desde 2013, los RDA (Resource Description and Access) como reglas de catalogación, codificando las descripciones según el formato MARC 21, como se ha dicho.

Este modelo de datos se ha analizando en distintos artículos, desde «Biblioteca Virtual: función y planteamiento» (2010) a «Data Aggregation and Dissemination of Authority Records through Linked Open Data in a European Context» (publicado en Cataloging & Classification Quarterly, v. 50, no. 8, 2012), presentado ya en 2011 en la Conferencia Anual de IFLA celebrada en Puerto Rico.

Pantallazo. Registro de Crisóstomo Martínez

Enriquecimiento semántico

La Fundación Ignacio Larramendi ha afrontado la imposibilidad técnica y económica de enriquecer semánticamente los registros de autoridad de polígrafos y de poligrafistas con medios tradicionales. El objetivo no es otro que facilitar la navegación e incrementar la visibilidad de la información disponible sobre la materia. Así, los registros presentan numerosos enlaces a recursos de bibliotecas que ya se han adaptado a Linked Open Data.

Por ello, ya desde la Biblioteca Virtual de la Escuela de Salamanca 3.0 (2018) ha definido un procedimiento semiautomático de reconciliación y enriquecimiento semántico que se ha realizado, y actualizado, sobre los cerca de 1.000 autores, entre polígrafos y poligrafistas, que se incluyen en la Biblioteca Virtual de Polígrafos. Las técnicas de Data Validation and Reconciliation, que se suele traducir con la expresión «reconciliación», han permitido automatizar la vinculación de las personas, no los nombres de las personas, con muchos más vocabularios de valores. Este procedimiento ha dado lugar a que la totalidad de los autores de la Biblioteca Virtual de Novatores estén vinculados, cuando es posible, con 17 vocabularios de valores diferentes.

Pantallazo. Vicente Mut en Wikidata

Estos vocabularios se han seleccionado por tres criterios fundamentales. En primer lugar, los vocabularios de valores y fuentes que concentran un mayor número de descripciones y que se relacionan con un mayor número de fuentes externas, como son VIAF y Wikidata. En segundo lugar, los vocabularios de valores (o registros de autoridad) de bibliotecas y catálogos colectivos del entorno cultural de la Biblioteca Virtual de Polígrafos, como el Linked Data Service: Authorities and Vocabularies de la Library of Congress, el Gemeinsame Normdatei de la Deutsche Nationalbibliothek, la base de datos de la Bibliothèque Nationale de France en datos abiertos vinculados, el portal de datos bibliográficos, datos.bne.es, de la Biblioteca Nacional de España, o la Biblioteca Virtual Miguel de Cervantes también como datos abiertos. Y, en tercer lugar, se han establecido vínculos con recursos en los idiomas más relacionados con los propios polígrafos, como son, además del castellano, el catalán, el gallego, el portugués y el vasco. Por este motivo, se ha extendido la vinculación a las DBpedias en los idiomas mencionados. Es decir, aunque pueda parecer redundante, la extensión de los vínculos semánticos tiene como objetivo fortalecer la red de relaciones del entorno cultural de la Biblioteca Virtual de Polígrafos en la Web Semántica.

Pantallazo. DBpedia

logo. Sello PYME InnovadoraDIGIBÍS, bajo la dirección de su directora general Tachi Hernando de Larramendi, ha integrado estas técnicas en su cartera de servicios y ha realizado tratamientos análogos de reconciliación y enriquecimiento de registros de autoridad de personas, instituciones y lugares para la Biblioteca Digital de Castilla y León, la Biblioteca Dixital de Galicia o la Biblioteca Virtual del Ministerio de Defensa. Este proyecto de reconciliación y enriquecimiento semánticos de registros de autoridad con vocabularios de valores ha formado parte de los proyectos de Innovación de los años 2016 y 2017, denominados «Recolección y reconciliación de datos abiertos» y «Diseño y usabilidad de datos abiertos. Exportación, transformación y carga», presentados al Ministerio de Ciencia, Innovación y Universidades y refrendado con sendos certificados de AENOR. Hay que decir que desde el proyecto «Ontología y Web Semántica de Polígrafos», en 2004, financiado por el Plan Nacional de Investigación Científica, Desarrollo e Innovación Tecnológica y Fomento de la Investigación Técnica 2004-2007 (PROFIT), la mayoría de los proyectos de I+D+i de DIGIBÍS están relacionados con desarrollos implementados en la Biblioteca Virtual de Polígrafos.

Pantallazo. Ficha y MARC21 de Juan de Cabriada

Otra destacable faceta semántica con la que la Fundación Ignacio Larramendi sustenta su Biblioteca Virtual de Polígrafos son los Estudios sobre polígrafos, una colección de libros electrónicos que acompaña las recopilaciones de obras de cada autor. Estos estudios se solicitan a especialistas e investigadores y tienen también un tratamiento específico de datos abiertos vinculados, ya que las versiones electrónicas en EPUB, MOBI y PDF van acompañadas de su correspondiente DOI, mientras que los poligrafistas (es decir, los autores que se ocupan de los polígrafos), se identifican por medio de ORCID. A día 30 de octubre de 2019 se cuenta con 153 libros electrónicos que se pueden descargar gratuitamente.

Pantallazo. Ficha del estudio sobre Vicente Mut

La agregación de recursos digitales y reutilización de datos abiertos

Sobre este modelo bibliográfico, el modelo digital consiste, como se explicará más adelante, en objetos digitales obtenidos por medio de la digitalización de obras de esos autores. La novedad radical de estos objetos digitales es que en su gran mayoría se aportan al proyecto a partir de catalogaciones de terceros, fundamentalmente de Hispana, a través de su servidor SRU (Search/Retrieval via URL),

Pantallazo. DIGIBIB SRU/SRW

y de Europeana a través de su API de búsqueda, Europeana Search API.

Pantallazo. Europeana Search API

La Biblioteca Virtual de Polígrafos, así como las bibliotecas temáticas y de autor que también la conforman, se han beneficiado muchísimo del proyecto Hispana y del proyecto Europeana. Para un mayor detalle de la relación de las distintas iniciativas españolas relacionadas con Europeana puede consultarse el número monográfico del Boletín ANABAD (tomo LXIII (2013), nº 3, julio-septiembre) dedicado a Europeana, que incluía también múltiples referencias a Hispana.

Difícilmente habría sido posible llevar a cabo las diferentes bibliotecas virtuales, desde la Biblioteca Virtual de la Escuela de Salamanca del año 2010 hasta su nueva versión 3.0 del año 2018, o esta Biblioteca Virtual de Novatores, sin los medios dispuestos por Hispana y Europeana para acceder a sus datos. Sin ello no habría sido posible que las descripciones bibliográficas y los objetos digitales se hubieran integrado en estas bibliotecas virtuales. Además, cuestión que es muy importante, tanto Hispana como Europeana han fomentado muchísimo que la digitalización de los materiales bibliográficos se haga conforme a una metodología precisa, expresada en las distintas convocatorias para la concesión de Ayudas a la digitalización del patrimonio bibliográfico y su difusión y preservación mediante repositorios del Ministerio de Cultura y de los distintos documentos de Europeana sobre los requisitos de calidad de los metadatos y objetos digitales, especialmente en el Europeana Publishing Framework. La Biblioteca Virtual de Polígrafos de la Fundación Ignacio Larramendi ha podido, por tanto, vincularse a muchísimos proyectos de digitalización de toda Europa y, en particular, de España, cosa que habría sido muy difícil hacer cuando comenzó su andadura.

Hay que decir que esas vinculaciones no se refieren a meros enlaces informáticos, sino que se trata, en la mayoría de los casos, de URIs HTTP, mucho más robustas y con mayores funcionalidades que las tradicionales URLs, que prescribe la tecnología Linked Open Data.

Al igual que la Fundación Ignacio Larramendi ha desarrollado sus bibliotecas virtuales al compás de las bibliotecas virtuales desarrolladas por DIGIBÍS y se han influido mutuamente, Hispana es también un desarrollo de DIGIBÍS para el Ministerio de Cultura de España que está implementado en su aplicación DIGIHUB. Este programa tiene muchas similitudes con el programa DIGIBIB, por ejemplo el uso de los repositorios OAI-PMH, que juegan un papel importantísimo en los tres proyectos, la Biblioteca Virtual de Polígrafos, Hispana y Europeana. También hay una cierta influencia de la Fundación Ignacio Larramendi en Europeana, puesto que el director de Proyectos de esta Fundación, Xavier Agenjo Bullón, ha formado parte de distintas taskforces de Europeana. En concreto, su aplicación de la ontología Europeana Data Model (EDM) es caso de estudio de EDM en Europeana. Este caso de estudio de EDM está basado en la Biblioteca Virtual dedicada a Francisco Sánchez, el Escéptico, y las relaciones y vínculos entre Pirrón, Sexto Empírico, Montaigne, Descartes, y otros, con el propio filósofo.

Agregación de datos por medio de servicios SPARQL

También dentro de la tecnología Linked Open Data, se han utilizado servidores SPARQL de terceros para acceder a registros bibliográficos de proyectos tales como la Biblioteca Virtual Miguel de Cervantes o la Biblioteca Nacional de España, que incluye los datos de la Biblioteca Digital Hispánica, como se describió en «Agregación de datos bibliográficos por medio de servicios SPARQL» (Anuario ThinkEPI, v. 13, 2019).

Pantallazo. SPARQL Biblioteca Virtual Miguel de Cervantes

En esta nueva Biblioteca Virtual de novatores se han agregado objetos digitales de la Biblioteca Nacional de España, que cuenta con servicio SPARQL para acceder a sus registros. Así, la Fundación Ignacio Larramendi ha incorporado 265 objetos digitales de la Biblioteca Digital Hispánica, al igual que se han incorporado otros 259 registros de la Biblioteca Virtual Miguel de Cervantes, como se hizo ya en la Biblioteca Virtual de la Escuela de Salamanca 3.0.

El propósito de los datos abiertos vinculado servidos a través de servicios SPARQL Endpoint es que se puedan compartir y asociar semánticamente y por ello en esta Biblioteca Virtual de Novatores hemos hecho un uso notable de esta importante facilidad que ofrecen tanto nuestra Biblioteca Nacional como la Biblioteca Virtual Miguel de Cervantes. Por este medio se han obtenido, en total, 524 nuevas descripciones bibliográficas de obras digitalizadas, lo que supone un 28,74 % del total de los registros (1.823), lo que es especialmente importante para un conjunto de autores cuya obra permanece muy poco conocida y que es citada de segunda mano.

Justamente, en los días que se ha redactado esta nota la Bibliothèque nationale de France, siguiendo las directrices de Open Access, acaba de hacer accesibles, sin restricción alguna, todos los objetos digitales que conforman el maravilloso proyecto Gallica.

Estos procedimientos, que se pusieron en práctica ya desde la Biblioteca Virtual de Viajes Científicos Ilustrados, han sido certificados, como se ha dicho, en 2016 y 2017 como proyectos I+D+i de DIGIBÍS por el Ministerio de Ciencia, Innovación y Universidades, tras el correspondiente informe favorable de la Asociación Española de Normalización y Certificación (AENOR).

 Pantallazo. Virtuoso SPARQL Query Editor

El modelo de datos: Europeana Data Model

El modelo de datos de Europeana lleva implícito un acuerdo no formal entre varias instituciones del ámbito de la información cultural en torno a la norma ISO 21127:2006 (Information and documentation-A reference ontology for the interchange of cultural heritage information), como quedó plasmado en la comunicación «El Modelo de Datos de Europeana», presentada en la 76th IFLA General Conference and Assembly de 2010 por Martin Doerr, Stefan Grandmann, Setffen Hennicke, Antoine Isaac, Carlo Meghini y Herbert van de Sompel (hay traducción al español de Ricardo Santos). Europeana Data Model reutiliza, entre otras, las siguientes ontologías: OAI Object Reuse and Exchange Terms Vocabulary; Simple Knowledge Organization System (SKOS); Dublin Core Metadata Element Set; DCMI Metadata Terms, DCMI Type Vocabulary y el ya mencionado Conceptual Reference Model (ISO 21127), lo que le da un valor inmenso para representar objetos culturales, así como su plasmación digital. Europeana Data Model se utiliza ampliamente en el dominio de las bibliotecas virtuales de todo el mundo; además de en Europa, en Australia, Nueva Zelanda, Corea y Brasil, es la base del modelo de datos del proyecto de la Digital Public Library of America.

Pantallazo. DPLA Metadata Application Profile

Los registros de la Biblioteca Virtual de Novatores utilizan también la ontología EDM en la versión 5.2.8. Una de las funcionalidades más importantes del programa DIGIBIB es que transforma automáticamente registros en EDM a partir de registros MARC 21 que alimentan su repositorio OAI-PMH. De este modo, el usuario no tiene que realizar tareas repetitivas y, así, a partir de los registros MARC 21 de base se generan de forma transparente registros en Dublin Core (en diferentes formatos), en EDM y otros.

Repositorio OAI-PMH adaptado al modelo de datos de Europeana

Todos estos procesos de vinculación con otras fuentes Linked Open Data están también disponibles a través del repositorio OAI-PMH de la Biblioteca Virtual de Polígrafos. Esta es una de las grandes ventajas de que nuestro repositorio esté adaptado al modelo de datos de Europeana, que transmite de forma transparente para los bibliotecarios de la Fundación Ignacio Larramendi todos los datos y vínculos de nuestros polígrafos. Y que estos datos, tras las periódicas recolecciones de los servicios de agregación, estén disponibles en Hispana, Europeana y OAIster, lo que proporciona a nuestro proyecto un añadido muy importante de visibilidad y accesibilidad.

DIGIBIB está diseñado para incluir dentro de la aplicación un repositorio OAI-PMH, de forma tal que los registros bibliográficos, de autoridades, o de ejemplares (fondos y localizaciones) alimentan el repositorio de forma transparente y dinámica, lo que ahorra dobles catalogaciones, una en la base de datos bibliográfica y otra en el repositorio OAI-PMH, como ocurre en las aplicaciones que usan muchas bibliotecas. Esto, desde luego, no solamente elimina el esfuerzo de las dobles catalogaciones, sino que evita los consiguientes errores en los datos.

Pantallazo. Ficha del libro Arithmetica demonstranda... en la Biblioteca Virtual de Polígrafos de la FIL

Como ejemplo, los registros del repositorio OAI-PMH de la Biblioteca Virtual de Novatores son recolectados por el agregador OAIster, de la OCLC , y en consecuencia, de forma automática, pasan a formar parte del WorldCat que, como se sabe, está compuesto por los catálogos de 72.000 bibliotecas de 123 países y ofrece, según cifras de mayo de 2019, casi 497 millones de registros bibliográficos y más de 2.800 millones de registros de ejemplares. Se entiende, pues, que la inclusión de un registro bibliográfico en la Biblioteca Virtual de Novatores comporta, de forma totalmente automática, una extraordinaria visibilidad y accesibilidad.

Pantallazo. Ficha del libro Arithmetica demonstranda... en WorldCat

Wikipedia y Wikidata

Desde el primer momento, la Fundación Ignacio Larramendi ha considerado el plus de visibilidad que la Wikipedia proporciona. Como se sabe, Wikipedia es el quinto recurso más utilizado de toda la Web, y, por lo tanto, y siguiendo el criterio biblioteconómico de la presencial real, se ha buscado en todo momento ampliar la presencia de las bibliotecas virtuales y de las descripciones de polígrafos en Wikipedia. Por ello, la Fundación Ignacio Larramendi, siempre en colaboración con DIGIBÍS, ha profundizado en una serie de técnicas relacionadas con la tecnología Linked Open Data para tratar de forma más eficiente los registros de autoridad, por un lado; y por otro lado, para vincular esos registros con Wikidata, como se expuso en «Registros de autoridades, enriquecimiento semántico y Wikidata» (Anuario ThinkEPI, v. 12, 2018).

En esta Biblioteca Virtual de Novatores se ha querido desarrollar el procedimiento inverso a la vinculación con Wikidata, es decir, que esta base de conocimientos tenga definida una propiedad específica para identificar a los autores de la Biblioteca Virtual de Polígrafos para que de este modo queden enlazadas las descripciones de Wikidata con el correspondiente identificador de la Biblioteca Virtual de Polígrafos. Para ello se ha utilizado la herramienta de Wikidata denominada Mix'n'match que facilita la conexión de los registros de autoridad de los autores o polígrafos, de forma semiautomática, con las descripciones que proporciona Wikidata.

Pantallazo. Mix'n'match

Así, el identificador propio de la Biblioteca Virtual de Polígrafos de la Fundación Ignacio Larramendi, «BVLarramendi ID», es la propiedad P6907 dentro de la ontología de Wikidata [https://www.wikidata.org/wiki/Property:P6907], que a su vez es una instancia de la clase Wikidata property for authority control for people.

Pantallazo. Wikidata Property P6907

En el momento de redactar este texto, 850 personas en Wikidata disponen de un enlace al identificador de la Biblioteca Virtual de Polígrafos. Las Wikipedias que contienen artículos de más de 200 polígrafos son las versiones en inglés (708), francés (571), catalán (421), alemán (413), italiano (390), portugués (377), ruso (332), polaco (258), sueco (220), árabe (217), vasco (213) y esperanto (211). En este enlace se puede acceder a la distribución de artículos de polígrafos en los distintos idiomas de Wikipedia.

Pantallazo. Wikidta: id BVLarramendi

Wikipedia utiliza el control de autoridad de Wikidata para relacionar cualquiera de sus entradas con los registros de autoridad de las grandes bibliotecas del mundo, como la Biblioteca Nacional de España, la Biblioteca Virtual Miguel de Cervantes, la Bibliothèque Nationale de France, la Library of Congress, la Deutsche Nationalbibliothek y otras. De este modo, el apartado «Control de autoridades» se convierte en una red de vínculos con distintos recursos de información, ya sean bibliotecas o repositorios digitales. A medida que vaya progresando el tratamiento de datos de la propia Wikipedia, estos vínculos estarán disponibles en todos los idiomas de Wikipedia.

Pantallazo. Wikipedia. Control de autoridades

Este trabajo sobre Wikidata ha dado lugar también a que los bibliotecarios de Wikipedia hayan creado una plantilla específica para crear enlaces automáticamente a la Biblioteca Virtual de Polígrafos.

Pantallazo. Wikipedia plantilla Larramendi

Acceso a los datos abiertos vinculados

Todos los datos de la Biblioteca Virtual de Polígrafos (Polymath Virtual Library) está disponible en diferentes servicios:

Con esta tecnología la Biblioteca Virtual de Polígrafos va incorporando en todas las entregas nuevos procedimientos tecnológicos para facilitar los fines fundacionales de la Fundación Ignacio Larramendi, es decir, facilitar la visibilidad y la accesibilidad del pensamiento científico filosófico de España y de Hispanoamérica desde los orígenes, que se pueden datar en la obra de Séneca, hasta las aportaciones del andalusí Averroes, el sefardí Maimónides, el mallorquín Llull, el valenciano Vives y el granadino Suárez, para incidir solamente en las seis escuelas de pensamiento que Menéndez Pelayo quería ver en España.

Madrid, 24 de septiembre de 2019