quinta-feira, 30 de setembro de 2010

A Web Semântica e suas contribuições para a ciência da informação

SOUZA, R. R; ALVARENGA, L. A Web Semântica e suas contribuições para a ciência da informação. Ciência da Informação, v. 33, n. 1, 2004. Disponível em: < http://revista.ibict.br/index.php/ciinf/article/view/50/49 > . Acesso em: 29 set. 2010.

O artigo trata do processo de atualização pelo qual passa a World Wide Web na sua transição para a chamada Web Semântica. Os autores buscam identificar as tecnologias, organizações e conceitos associados a essa nova web. E também mostram a relação da web semântica com a ciência da informação.

A web semântica não é uma web separada, sendo uma extensão da atual, um melhoramento dessa mesma web que foi criada para implantar o conceito de hipertexto, oferecendo interfaces amigáveis e intuitivas para facilitar o acesso ao imenso repositório que é a Internet.

A recuperação da informação é o que busca a Web Semântica. Os autores fazem a analogia com as tecnologias de recuperação da informação usados na documentação, biblioteconomia e na ciência da informação. Os sistemas de recuperação da informação passaram a ser mais necessários com o boom informacional e como a web passou a ser um crescente repositório de informação se faz necessário o uso de ferramentas mais adequadas para facilitar o acesso às informações nela armazenadas, como o uso de indexação e descritores, a aplicação de um vocabulário uníssono, para criar um ambiente de trocas.

O World Wide Web Consorttium (W3C) projetou a Web Semântica para embutir inteligência e contexto nos códigos XML (eXtensible Markup Language). usados na web visando uma melhoria de interação entre os programas usados e possibilitar uma utilização mais intuitiva. O W3C recomenda padrões para uso na web, como a linguagem XML, o Dublin Core e o RDF, para se obter mais interoperabilidade na web.

O XML foi recomendado para a construção de documentos a serem exibidos no computador que possui um conjunto de DTD, que são tags, marcações para a descrição dos dados e comandos desses documentos e por ser uma flexível permitindo que o criador do documento web adicione novas tags.

O Dublin Core foi recomendado como uma padronização dos metadados usados nas tags do XML uma vez que não basta só ter os metadados eles precisam ser unanimes e inteligíveis para se evitar a ambigüidade, pois não há muita diferença no âmbito da web entre as tags e . O Dublin Core é composto de 15 elementos de metadados (title, creator, subjetc, description, Publisher, contributors, date, type, format, identifier, source, language, relation, coverage e rights), sendo ele uma iniciativa para criação de um vocabulário controlado para uso na web.

O RDF (Resource Descriptions Framework) é mais uma recomendação do W3C que encerra uma padrão de ontologias para descrição de recursos de Internet. O RDF estabelece um padrão de metadados a serem embutidos na codificação XML, onde os metadados são descritos em “triplas” de recursos – propriedade – valor que forma uma corrente de acesso aos padrões de metadados (namespace) como o Dublin Core. Os namespaces, as ontologias e o padrão RDF vão permitir que qualquer um publique informações na web de forma que os produtos de software ou agentes possam interpretar e agir semanticamente sobre essa informação marcada de maneira inteligente, pois com o RDF se tem uma sintaxe padrão para a descrição dos recursos da web. O RDF ainda é uma evolução e se estudam soluções para os namespaces, assim as ontologias estão sendo estudadas e criadas de maneira compartilhada para agir como namespaces mais genéricos.

As ontologias se aproximam dos conceitos de tesauros e vocabulários controlados, pois no contexto da web semântica, dentro da ciência da informação as ontologias vão descrever as relações entre termos e seus conceitos, criando um vocabulário compartilhado para trocar informações. Diversos padrões estão sendo desenvolvidos para a construção e compartilhamento das ontologias como o DAML+OIL (DARPA Agent Markup Language) que é uma linguagem baseada no XML que possui mais capacidade na descrição de objetos e no seu relacionamento, para expressar semântica e criar alto grau de interoperabilidade entre sites da web.

A web semântica pode ser vista como um grande sistema de recuperação de informações. Sendo as ferramentas e tecnologias de anotação semântica das páginas web para construção de ontologias compartilhadas, como a indexação e representação dos documentos. Essas ferramentas permitirão a existência de paginas web marcadas semanticamente com metadados que permitirão aos motores de busca um uso mais significativo da informação na web, através agentes (programas) que rastreiem e coletem os dados de forma automática usando um certo nível de “compreensão” dos seus conteúdos de modo que a informação recuperada seja mais significativamente pelos usuários, daí um paralelo ente revocação e precisão no resultado de busca.

Com a web semântica se vislumbra: a construção de novas linguagens e formas artificiais de indexação automática, a construção de novas interfaces com o usuário, usando sistemas de informação mais intuitivos e coerentes e o uso de mapas conceituais de acordo com o perfil do usuário. Outra promessa é a construção automática de tesauros e vocabulários controlados, que partiria das marcações semânticas dos documentos e das relações tríplices do RDF, recurso - propriedade - valor. A indexação automática dos documentos por meio das ontologias e a gestão do conhecimento de forma geral com o uso dessas tecnologias.

A web semântica é uma promessa muito discutida e aguardada, pois quando aplicada em plenitude trará um ganho imenso para os usuários e para os que trabalham com a gestão de conteúdos, facilitando o armazenamento, a troca, a localização, o acesso, a disseminação e o gerenciamento da informação.

Nenhum comentário: