miércoles, 21 de septiembre de 2011

Web semántica y ontologías parte 2.

Para cumplir con el objetivo de integrar datos provenientes de distintas fuentes (servidores, servicios, bases de datos, compañías, etc.) y, lo mas importante, poder interactuar con todos esos datos, es necesario que los datos se encuentren en un mismo formato.

El modelo de datos que utilizamos para este fin es conocido como RDF (Resources Description Framework, Framework de descripción de recursos).

RDF básicamente consiste en una colección de tripletas (en inglés lo encontramos como “triples”), cada una conformada por un sujeto, un predicado y un objeto.

Para el caso de nuestro ejemplo anterior:

Sujeto

Predicado

Objeto

objeto 1es unataza
objeto 1pertenece aautor
objeto 1contienecafé
objeto 1está contenido enobjeto 2
objeto 2es unlaboratorio

Esta estructura nos sirve para visualizar la información como un grafo dirigido y etiquetado: El sujeto y el objeto se representan como nodos en el grafo y las relaciones entre ellos como arcos:

ejemplo de un grafo

Esta representación será la que nos permita que la información que tengamos almacenada, como se ha venido comentando, en diferentes servidores, bases de datos, compañías, etc., pueda ser analizada de forma visual.

Existen actualmente bastantes herramientas para almacenar, administrar, solicitar, editar y trabajar con información en este formato.

Aquí un listado con algunas de estas herramientas.

En mi caso particular, he trabajado con Jena y actualmente estoy trabajando con Sesame debido a que donde trabajo desarrollamos bastante con Java.

En futuras ocasiones presentaré algunos trabajos que he realizado utilizando estas herramientas, principalmente orientadas al análisis de información.

Para aprender un poco más al respecto sobre estos temas, hay una pequeña lectura en W3C:http://www.w3.org/standards/semanticweb/data