Nuestra intención en esta sección es explicar en qué consiste, de qué se compone la bilbioteca digital, un concepto emergente concebido para dar acceso universal a toda la información digital en la red. Dado que no existe una única definición de la biblioteca digital podemos ofrecer algunasde estas definiciones; la biblioteca digital como (extraido del libro La biblioteca digital):
Una colección organizada de documentos digitales para cuya consulta se precisa de un ordenador, unos programas informáticos y, en algunos casos, de un sistema de telecomunicaciones compuesto por un modem, una línea telefónica, una empresa que facilite el acceso a las redes teleáticas y unos programas de comunicaciones.
Organismo o parte de él cuya función principal consiste en constituir bibliotecas digitales, mantenerlas, actualizarlas y facilitar el uso de los documentos digitales que precisen los usuarios para satisfacer sus necesidades de información, investigación, educación o esparcimiento, contando para ello con personal especializado.
Por otra parte en la web del Digital Library Project, hay una definición de biblioteca digital, que proviene del Santa Fe Workshop on Distributed Knowledge Work Environments y dice así:
La biblioteca digital no pretende "copiar" la producción impresa, sino que debe generar una nueva estructura de la información; el uso de documentos hipertextuales hacen que un "libro electrónico" ya no sea lineal, como ocurre con la confección en papel, sino que el libro ahora tambien posee profundidad", el usuario tiene acceso a la información de formas muy variadas, cuenta con la osibilidad de proveer vínculos no solo a documentos textuales, sino también a imagen y vídeo, de modo instantáneo, lo cual permite explicar dichos contenidos de formas diversas."El concepto de biblioteca digital no es únicamente el equivalente de repertorios digitalizados con métodos de gestión de la información. Es más bien, un entorno donde se reúnen colecciones, servicios, y personal que favorece el ciclo completo de la creación, difusión, uso y preservación de los datos, para la información y el conocimiento".
Todo este cambio no se puede llevar a cabo sin que se produzca un proceso de innovación tecnológico que implica a las diferentes partes involucradas en el desarrollo de la biblioteca digital, como son la modificación de la organización de la información, su producción y la difusión de la misma.
Algunos elementos comunes que definen la biblioteca digital son: La biblioteca digital no debe ser una entidad individual, se requieren medios tecnológicos para enlazar recursos, los usuarios deben poder acceder a los enlaces entre bibliotecas digitales y servicios de información de manera transparente. El acceso universal a las bibliotecas digitales y a los servicios de información debe ser un objetivo principal.
Sin embargo, no todo es fácil ni simple a la hora de pensar en la biblioteca digital, existen una serie de problemáticas que ponen freno su rápida expansión, mencionaremos algunas de ellas:
Disponibilidad: todo lo que existe registrado (impreso, fotografiado, filmado, pintado, dibujado, etc.) tendría que convertirse a formato digital para que esté disponible a todos los usuarios con un terminal de trabajo.
Recuperación y adecuación: cada usuario de este hipotético terminal de trabajo (que permitiría el acceso a la biblioteca digital) tendría que poder acceder a todos los documentos electrónicos relevantes de este universo digital, de una manera rápida y fácil.
Autenticidad: cada usuario debería tener la seguridad de que el documento que encuentra en la red es el documento auténtico y original.
Utilización: cada uno de los documentos recuperados mediante el terminal de trabajo tendría que ser recuperado de forma que todo usuario pudiera utilizarlo.
Protección de la propiedad intelectual: la protección de los derechos de autor debería estar garantizada en todo documento recuperado, ¿o quizá no? Sobre derechos de autor hablaremos más adelante.
Asequibilidad: los costes de acceso y recuperación de los diversos documentos tendrían que ser razonables y no superar los costes de sus equivalentes tradicionales.
De todas formas el interés por la biblioteca digital está creciendo en todo el mundo, en Estados Unidos el interés ha aumentado gracias a la creación en 1994 de la Digital Libraries Initiative, patrocinada por la NSF (National Science Foundation), la DARPA (Defense Advanced Research Projects Agency) y la NASA, en Europa un ejemplo significativo es el de la Bibliothéque Nationale de France que ha digitalizado 100.000 volúmenes, 40.000 de los cuales están libres de derechos de autor. Se puede encontrar más información sobre este proyecto en ??no lo pone. En América Latina existen varios proyectos interesantes. Entre ellos están: la Biblioteca Digital Latinoamericana y Caribeñaa (BD-DL) y Biblioteca Virtual de Salud de América Latina y el Caribe (BVS).
La web semántica es el futuro de la web, una web que facilitará la localización de recursos, la comunicación entre sistemas y programas, que nos ayudará a gestionar nuestro día a día, hasta llegar a niveles que hoy pueden ser considerados como de ciencia ficción.
La red semántica no es una red independiente de la actual, sino una ampliación; una red en la cual la información está dotada de significados bien definidos, con el fin de que la coordinación del trabajo entre humanos y ordenadores sea más completa. Se han dado ya los primeros pasos para incluir la red semántica en la estructura de la red ya existente. En un futuro no lejano, estos desarrollos introducirán prestaciones nuevas e importantes, al lograr que las máquinas multipliquen su capacidad de procesar y comprender los datos que hoy tan sólo se exhiben en pantalla. En su universalidad el hipertexto permite "conectar cualquier cosa con todo", por tanto la técnica no debe discriminar entre un borrador y la prestación más depurada, entre información comercial y académica, ni entre culturas, idiomas, etc. No generamos el mismo tipo de información si estamos pensando en una persona o en una máquina, así tenemos por un lado un video de 5 sec. ??son segundos? a una poesía y por el otro están las bases de datos, programas hechos por friskis informáticos...
Hasta ahora, la red estaba concebida más para proporcionar documentos a los humanos que para manipular datos o y procesar información de manera automática, pero a partir de ahora tenemos que cambiar el chip pues nos encontramos frente a una potente herramienta facilitadora de la comunicación, que es la red semántica. además ésta no pierda una de las características esenciales que es ser descentralizada.
Antes de explicar cómo funcionará la red semántica, describiremos los elementos necesarios que la comprondrán, así: XML, RDF, PICS, ONTOLOG’IAS y AGENTES.
XML
XML (eXtensive Markup Language), permite la codificacion para la distribucion de documentos complejos por Internet. Vamos a dar unos datos previos que harán más fácil entender por qué se elige este formato. SGML (Standard Generalized Markup Language) es una norma que pretende establecer una manera genérica de especificar, definir documentos, que permita a su vez usar formatos de mayor flexibilidad y portabilidad. Con lo cual reune tres condiciones básicas:
1. Formal: pues permite establecer la validez de los documentos.
2. Estructurado: para que sea capaz de manejar documentos complejos.
3. Ampliable: para facilitar la gestión de grandes depósitos de información.
XML es un subconjunto de SGML, y define un formato de texto diseñado para la transmisión de datos estructurados. Al ser un subconjunto de SGML mantiene sus caracteristicas de validación, estructurado, y especialmente facilita la extensibilidad, porque es un metalenguaje que permite describir lenguajes de marcas, tanto la definicion de etiquetas como la relacion estructural que existen entre ellas. Un ejemplo de como funciona XML se muestra en el listado 1.
XML
RDF
RDF son las siglas definen Resource Description Framework (algo así como marco de descripción de recursos). Como su nombre indica, el área en la que está enmarcado es la descripción de recursos de la red, entendiendo por recurso todo lo que nos de de sí la imaginación en tanto que a definir cualquier cosa, páginas, personas, dispositivos... RDF permite que las condiciones que se quieren "preguntar" sobre un recurso sean definidas como un conjunto de propiedades que componen el esquema.
RDF ofrece una estructura semántica inambigua (por el uso de los URI, Uniform Resource Identifier) que permite codificación, intercambio y procesamiento automático de los metadatos normalizados. RDF proporciona también reglas para facilitar técnicamente la manera de explicar conceptos de modo que los ordenadores puedan procesarlo rápidamente y proporciona un medio que posibilita la edicición de vocabularios con propiedades definidas para la descripción de los recursos de una comunidad.
RDF usa la sintaxis del lenguaje XML para el intercambio y procesamiento de metadatos, las condiciones se recogen en los rdf: Descripcion de los elementos XML.
PICS
Los PICS, (Platform for the Internet Content Selection), nos indican lo adecuado o conveniente de determinados ficheros de datos segun la comunidad en la que se encuentre el usuario. Es una infraestructura para asociar las etiquetas con los contenidos de Internet. Aunque en un principio estaba destinado al control del acceso de los niños a Internet, su uso se puede extender a otras etiquetas que incluyan privacidad, licencias, etc. PICS es una plataforma sobre la cual se han construido otros servicios de clasificación que no sólo define una manera de construir etiquetas sino que es un mecanismo para realizar las valoraciones.Este mecanismo esta formado, al menos por lo siguiente:
Las etiquetas, que son los metadatos que indican la valoración de un documento.
Los servicios de valoración, es decir, las organizaciones, grupos o personas que realizan
una valoración.
Los perfiles, que son las reglas que da el usuario para definir el filtro para evitar recibir documentos no deseados.
Para que el filtrado de documentos no deseados se lleve a cabo, también es necesario un software cliente y otro servidor que tengan implementado el sistema de valoración.Estas funciones se pueden realizar por separado, lo cual permite que por un lado los desarrolladores de software puedan realizar una aplicación informática sin suministrar un sistema de valoración mientras que por otro una organización puede crear sistemas de valoración sin tener que desarrollar el software.
ONTOLOGÍAS
Las ontologías son colecciones de enunciados redactados en un lenguaje, como el RDF, que define las relaciones entre conceptos y especifica reglas lógicas para razonar con ellos. Los ordenadores "comprenderán" el significado de los datos semánticos de una página de la red siguiendo vínculos con ontologías especificadas.
AGENTES
El concepto de tecnología de agentes está aún en desarrollo, pero una definición que podemos manejar de agente es la siguiente: un agente es una entidad de software que funciona continua y autónomamente en un medio particular a menudo habitado por otros agentes y procesos, sin requerir de gu’ýa constante o intervención humana. En otras palabras, un agente es un asistente personal que está dentro de la computadora y que cumple varios roles en representación de una función específica o de un usuario. En la web semántica serán los encargados de realizar la búsqueda de servicios, para ello, la semántica facultará a los agentes para describir unos a otros la función exacta que realizan, y qué datos han de recibir para ello.
Los actuales buscadores de Internet, como google, se basan en un sistema en el que los usuarios meten manualmente los enlaces y al hacer una búsqueda se aplica un algoritmo de emparejamiento de patrones, que tiene en cuenta el número de veces que se hace referencia a cada url candidata a ser resultado de búsqueda. Si bien hemos aprendido a convivir con este sistema de búsqueda, la única información que recuperamos con él son conceptos descontextualizados, es decir, si en un buscador ponemos la palabra "flor" recuperaremos una editorial que se llame flor, una página web para expresar sentimientos en Internet y, si tenemos suerte, alguna página especializada en margaritas.
La web semántica nos permitirá hacer búsquedas precisas del tipo quiero el viaje más barato que hay entre Madrid y Barcelona, teniendo en cuenta que me gusta ir en ventanilla y en no fumadores. En el estado actual de Internet esto es ahora posible gracias a los sistemas multiagente. Donde un agente es una entidad de software que funciona continua y autónomamente en un medio particular a menudo habitado por otros agentes y procesos, sin requerir de guía constante o intervención humana. También debe poseer ciertas habilidades sociales, reactividad ante el mundo que le rodea y comportamiento basado en deseos que pertenecen a cada agente en particular. Los sitemas multiagentes se han propuesto como la mejor herramienta para realizar aprendizaje automático en Internet. Mediante esta herramienta es posible hacer recomendaciones acertadas del tipo "pincha en este sitio web, pues me parece que te interesa" o "esta persona tiene intereses muy similares a los tuyos, te interesaría contactar con ella" y esto lo hará software puro y duro, sin más intervención humana que la de la propia acción del usuario y acertarán. También será posible clasificar automáticamente sitios o documentos de una manera acertada y un montón de más cosas que ni siquiera nos imaginamos.
El problema con el que ahora se topa la tecnología de sistemas multiagente es la volatilidad y desestructuración de la información base para realizar las inferencias. Volviendo al ejemplo del sistema multiagente para encontrar el viaje de tus sueños el único lugar desde el que puede recuperar la información son páginas html en forma de tablas. Éstas páginas pueden cambiar su estructura cada mes, lo que requiere cambios de programación. Esto no es un problema si la información está almacenada y puede ser consultada desde bases de datos y/o ficheros xml/rdf. Hoy en día podemos ver cómo se popularizan foros al estilo de slashdot que dejan un fichero rdf (por ejemplo http://slashdot.rdf), donde quedan las noticias de manera estructurada. La idea es que éste u otros métodos de compartir la información dinámica se popularice. Mientras tanto esta tecnología quedará restringida a poderosas bases de datos centralizadas como por ejemplo las de Amazon, que hagan recomendaciones de compra en base a lo que ya se ha comprado.
[1]