Home > Gestão de conhecimento: potencializando a estratégia organizacional

LOD – Linked Open Data – Dados Abertos Vinculados

Fernando Zaidan

14/08/2013 às 9h51

Foto:

Nuvem do LOD - Setembro/2011

Olá Pessoal, tudo bem com vocês?

Como muitos dizem, o ano começa no Brasil depois do Carnaval!

Bem, do meu lado isto não é verdade. A coisa já está pipocando deste Janeiro.

Estou falando isto porque estou em falta com vocês e, justamente depois do carnaval, venho me redimir. Acontece que em um dos meus últimos posts aqui neste Blog, prometi adentramos no mundo do LOD ? Linked Open Data (cuja tradução livre seria dados abertos vinculados). Então, mãos-a-obra:

Incialmente, de nada seria do LOD se não houvesse a Web Semântica. Ademais, para que ocorra um movimento de dados na web, a utilização de tecnologias semânticas é imprescindível. Em uma web com integridade dos dados, necessita-se do apoio neste nível, em vez da apresentação. Desta forma, não teremos uma página apontando para outra página, mas um dado apontando para outro dado. Entra então a função primordial das URIs (Uniform Resource Identi?ers), que são as referências globais para possibilitar tal apontamento.

Na medida em que se desenha este cenário dos dados abertos vinculados (Linked Open Data), com interoperabilidade, será possível um modelo de dados onde a informação sobre uma única entidade esteja distribuída na web, sendo acessado por inúmeras organizações. Este modelo de dados fará parte da infraestrutura da web.

Contraponto o início dos estudos da web semântica, onde os dados estruturados eram escassos, e mais ainda, eram poucos e indisponíveis, hoje são encontrados inúmeros domínios com uma grande quantidade de dados. Dentre eles, os dados da Wikipédia, cujo banco de dados (estruturado!) no Linked Data é o DBPedia (www.dbpedia.org).

Podem ser exemplificados, também, os datasets (a função do dataset no LOD é agregar um conjunto de dados RDF) com dados de governos, saúde, educacionais, acadêmicos, entretenimento, etc. Não são poucas as iniciativas para um efetivo crescimento de dados no formato RDF.

Se a coisa está meio obscura para alguns de vocês, peço que recorram aos meus posts anteriores, onde escrevi um pouco sobre os primórdios da Web Semântica e seus conceitos básicos:

http://itweb.com.br/blogs/xml-rdf-e-owl-para-saber-um-pouco-mais-sobre-a-web-semantica-1/

http://itweb.com.br/blogs/xml-rdf-e-owl-para-saber-um-pouco-mais-sobre-a-web-semantica-2/

Vamos então ao LOD:

Para publicar e conectar dados estruturados na web precisou-se de um conjunto de práticas que foi denominado: Linked Data (dados abertos). Os conjuntos de dados existentes da web têm representação através das triplas RDF (Resource Description Framework), utilizando os links para os conjuntos de dados (datasets) participantes. Este projeto tem os mesmos princípios básicos da web, que Tim Berners-Lee enunciou: ser simples, possuir um design modular e contemplar a descentralização.

O início foi em 2007. Desde esta época, o W3C faz o suporte devido aos dados abertos, com os padrões necessários, e com isto, impulsionou a produção de dados na web.

Entretanto, como já são numerosos os datasets, o vocabulário heterogêneo dos dados e sua fragmentação natural no ambiente web, faz com que o consumo e reutilização tornem-se difícil. Mecanismos cada vez mais eficientes são criados a fim de permitir a utilização por qualquer interessado.

Tim Berners-Lee disse também que os Linked Data são:

  • Abertos e não proprietários: podem ser acessados por meio de uma ilimitada variedade de aplicações;
  • Modulares: não necessita de planejamento prévio para combinar com quaisquer outros Linked Data;
  • Escaláveis: uma vez que já exista dados no Linked Data, a adição de mais dados é feita de maneira fácil.

Olhe bem: não vamos desprezar a web de documentos, pois ela foi a grande inspiração para a web de dados.  Esta web (dos dados, e abertos) envolve a padronização da semântica por detrás. As ontologias (ontologia é a conceituação formal de um domínio, com compromisso no compartilhamento semântico. São instâncias - nós - representadas por relações que fazem sentido. Querendo saber um pouco mais sobre ontologias, consulte nossos posts), por se tratarem de consenso, fornecem a alternativa de integração dos dados de dos domínios específicos.

Com todos estes dados abertos e disponíveis, para que as aplicações acessem o Linked Data, precisam ser feitas através de consultas muito parecidas com SQL, que se chama: SPARQL.

Na sequencia deste post, vamos falar de dos assuntos para as coisas caminharem claramente:

- o SPARQL e o SPARQL endpoint;

- e a nuvem do LOD (imagem no topo do post).

Até breve!

Junte-se a nós e receba nossas melhores histórias de tecnologia. Newsletter Newsletter por e-mail