quinta-feira, 30 de setembro de 2010

A Web Semântica e suas contribuições para a ciência da informação

SOUZA, R. R; ALVARENGA, L. A Web Semântica e suas contribuições para a ciência da informação. Ciência da Informação, v. 33, n. 1, 2004. Disponível em: < http://revista.ibict.br/index.php/ciinf/article/view/50/49 > . Acesso em: 29 set. 2010.

O artigo trata do processo de atualização pelo qual passa a World Wide Web na sua transição para a chamada Web Semântica. Os autores buscam identificar as tecnologias, organizações e conceitos associados a essa nova web. E também mostram a relação da web semântica com a ciência da informação.

A web semântica não é uma web separada, sendo uma extensão da atual, um melhoramento dessa mesma web que foi criada para implantar o conceito de hipertexto, oferecendo interfaces amigáveis e intuitivas para facilitar o acesso ao imenso repositório que é a Internet.

A recuperação da informação é o que busca a Web Semântica. Os autores fazem a analogia com as tecnologias de recuperação da informação usados na documentação, biblioteconomia e na ciência da informação. Os sistemas de recuperação da informação passaram a ser mais necessários com o boom informacional e como a web passou a ser um crescente repositório de informação se faz necessário o uso de ferramentas mais adequadas para facilitar o acesso às informações nela armazenadas, como o uso de indexação e descritores, a aplicação de um vocabulário uníssono, para criar um ambiente de trocas.

O World Wide Web Consorttium (W3C) projetou a Web Semântica para embutir inteligência e contexto nos códigos XML (eXtensible Markup Language). usados na web visando uma melhoria de interação entre os programas usados e possibilitar uma utilização mais intuitiva. O W3C recomenda padrões para uso na web, como a linguagem XML, o Dublin Core e o RDF, para se obter mais interoperabilidade na web.

O XML foi recomendado para a construção de documentos a serem exibidos no computador que possui um conjunto de DTD, que são tags, marcações para a descrição dos dados e comandos desses documentos e por ser uma flexível permitindo que o criador do documento web adicione novas tags.

O Dublin Core foi recomendado como uma padronização dos metadados usados nas tags do XML uma vez que não basta só ter os metadados eles precisam ser unanimes e inteligíveis para se evitar a ambigüidade, pois não há muita diferença no âmbito da web entre as tags e . O Dublin Core é composto de 15 elementos de metadados (title, creator, subjetc, description, Publisher, contributors, date, type, format, identifier, source, language, relation, coverage e rights), sendo ele uma iniciativa para criação de um vocabulário controlado para uso na web.

O RDF (Resource Descriptions Framework) é mais uma recomendação do W3C que encerra uma padrão de ontologias para descrição de recursos de Internet. O RDF estabelece um padrão de metadados a serem embutidos na codificação XML, onde os metadados são descritos em “triplas” de recursos – propriedade – valor que forma uma corrente de acesso aos padrões de metadados (namespace) como o Dublin Core. Os namespaces, as ontologias e o padrão RDF vão permitir que qualquer um publique informações na web de forma que os produtos de software ou agentes possam interpretar e agir semanticamente sobre essa informação marcada de maneira inteligente, pois com o RDF se tem uma sintaxe padrão para a descrição dos recursos da web. O RDF ainda é uma evolução e se estudam soluções para os namespaces, assim as ontologias estão sendo estudadas e criadas de maneira compartilhada para agir como namespaces mais genéricos.

As ontologias se aproximam dos conceitos de tesauros e vocabulários controlados, pois no contexto da web semântica, dentro da ciência da informação as ontologias vão descrever as relações entre termos e seus conceitos, criando um vocabulário compartilhado para trocar informações. Diversos padrões estão sendo desenvolvidos para a construção e compartilhamento das ontologias como o DAML+OIL (DARPA Agent Markup Language) que é uma linguagem baseada no XML que possui mais capacidade na descrição de objetos e no seu relacionamento, para expressar semântica e criar alto grau de interoperabilidade entre sites da web.

A web semântica pode ser vista como um grande sistema de recuperação de informações. Sendo as ferramentas e tecnologias de anotação semântica das páginas web para construção de ontologias compartilhadas, como a indexação e representação dos documentos. Essas ferramentas permitirão a existência de paginas web marcadas semanticamente com metadados que permitirão aos motores de busca um uso mais significativo da informação na web, através agentes (programas) que rastreiem e coletem os dados de forma automática usando um certo nível de “compreensão” dos seus conteúdos de modo que a informação recuperada seja mais significativamente pelos usuários, daí um paralelo ente revocação e precisão no resultado de busca.

Com a web semântica se vislumbra: a construção de novas linguagens e formas artificiais de indexação automática, a construção de novas interfaces com o usuário, usando sistemas de informação mais intuitivos e coerentes e o uso de mapas conceituais de acordo com o perfil do usuário. Outra promessa é a construção automática de tesauros e vocabulários controlados, que partiria das marcações semânticas dos documentos e das relações tríplices do RDF, recurso - propriedade - valor. A indexação automática dos documentos por meio das ontologias e a gestão do conhecimento de forma geral com o uso dessas tecnologias.

A web semântica é uma promessa muito discutida e aguardada, pois quando aplicada em plenitude trará um ganho imenso para os usuários e para os que trabalham com a gestão de conteúdos, facilitando o armazenamento, a troca, a localização, o acesso, a disseminação e o gerenciamento da informação.

quarta-feira, 29 de setembro de 2010

Fundamentos da organização frente à produção de documentos.


A referência a produção de documentos não está aqui indicando a produção intelectual ou artística de seu conteúdo (obra do autor), mas a produção de formas de apresentação e de representação da obra, assim como de seus pontos de acesso em sistemas de informação documentária. Refere-se ao documento como uma forma de apresentação e como um conjunto sugerido de informações documentárias, e não como o conhecimento nele contido.

As informações documentárias são entendidas como aquelas apreendidas, registradas e armazenadas em sistemas de informação documentária de modo que sejam passíveis de recuperação e uso.

Segundo Scarpit citado por Couzinet, Regimbeau e Corbières (2001), as referências contêm não a informação propriamente, mas a designação do documento que contém a informação e a referência bibliográfica, o registro catalográfico e a ficha descritiva são etiquetas que permitem atestar a existência de um documento. O documento é uma prova e a menção de um documento é uma prova de que esse documento existe: é a prova da prova.

Torna-se dificil recuperar a fonte de referência quando são mal redigidas ou incompletas porque aquelas repousam sobre princípios de caracterização que devem ser respeitados para que o vinculo entre essas duas entidades etiquetas e documentos não seja rompido.

É possível notar que existe um grande avanço no que se refere à organização do conteúdo, mas necessitamos desenvolver e aprimorar teorias e métodos sobre a representação descritiva.

Concluímos pela noção de produção de documentos, no sentido documentário, como aquela realizada em um sistema de informação documentária, por meio da transformação do texto do autor em documento, o que implica na elaboração de formas de apresentação, representação e acesso a esses documentos.


ORTGEA, Cristina Dotta. Fundamentos da organização frente à produção de documentos. TransInformação, Campinas, 20(1): 7-15, jan./abr., 2008.
Disponível em: http://revistas.puc-campinas.edu.br/transinfo/viewarticle.php?id=196. Acesso em 25 set. 2010.

sábado, 25 de setembro de 2010

Governança de Conteúdo

Para garantir que um Portal Corporativo atenda seus objetivos, não basta utilizarmos as melhores ferramentas de tecnologia da informação e comunicação. Através da gestão de processos, deve-se estabelecer um conjunto de diretrizes e procedimentos que sistematizem a gestão de seus conteúdos, ou seja, a Governança de Conteúdos deste Portal.

O estabelecimento da política de governança deve ser iniciado no início do processo de desenvolvimento do portal apresentando seus objetivos, utilização, mecanismos de controles quando a percepção de seus usuários e regras de negócios da organização. Ao ser concluído deve ser amplamente divulgado para todos os envolvidos.

Através de diagnóstico desenvolvido em cada setor da empresa ou instituição, quanto as necessidades de conteúdos a serem disponibilizados, inicia-se o processo da Política de Governança. Com estes dados será ser estabelecido o “fluxo das informações” de cada área da organização.

Entre os princípios na elaboração desta política deve-se observar principalmente, a transparência e atualização dos assuntos, padronização das diretrizes e verificação contínua quanto ao cumprimento das metas e objetivos planejados para o portal.

Alguns itens são essenciais neste documento: instruções e padronizações de layout e conteúdo, matriz de responsabilidades, indicação de autoridade para aprovação dos conteúdos, confiabilidade das informações, responsável pelo suporte e periodicidade das atualizações. Outro fator fundamental é o envolvimento de todos com o portal, motivando o comprometimento das pessoas.

Finalmente deverão ser esclarecidos e explicitados neste documento os critérios de segurança entre eles, a forma de relacionamento com terceiros que interagem com o portal, os critérios de privacidade quanto ao compartilhamento de informações e os direitos de uso e propriedade dos conteúdos e imagens (Lei de Direito Autoral - Lei nº 9.610, de 19/02/1998).
Salienta-se que a Política de Governança de um Portal Corporativo deve ser constantemente monitorada e modificada conforme sua evolução.

VIBERTI, Fernando. Política de governança: estrutura mínima. Disponível em: http://intranetportal.org.br/wp/2005/03/politica-de-governanca-estrutura-minima/. Acesso em 24.09.2010.
VIBERTI, Fernando. Governança de conteúdo: elaborando a política. Disponível em:
http://intranetportal.org.br/wp/2005/02/governanca-de-conteudo-elaborando-a-politica/ Acesso em: 25.09.2010.

quinta-feira, 23 de setembro de 2010

RESENHA - Mapa conceitual


LIMA, G.A.B. Mapa conceitual como ferramenta para a organização do conhecimento em sistema de hipertexto e seus aspectos cognitivos. Belo Horizonte, Perspectiva em Ciência da Informação, v.9,n.2,p.134-135,jul./dez. 2004.

Desenvolvidos por Novak e Hanesian e proposto por Ausubel como forma de instrumentalizar a teoria da aprendizagem significativa do mesmo. Os mapas conceituais são como diagramas que relacionam conceitos segundo uma ordem hierárquica por meio de palavras ou símbolos inseridos dentro de círculos, retângulos etc. Para seu entendimento e ou construção é preciso que o aprendiz tenha um conhecimento prévio do assunto a fim de associá-los e estruturá-los em uma ordem que mantenha relações entre o conteúdo de cada balão.
A construção de mapas nos permite compreender como ocorre a organização da informação, baseando-se na interpretação, comparação e síntese oferecidas, conseqüentemente nos permite conhecer como o conhecimento é organizado e construído.
O mapa conceitual, como componente da navegação hipertextual, é a técnica de representar conhecimento em forma gráfica, construindo uma rede de conhecimento constituída de nodos e links, nos quais os nodos representam os conceitos e os links representam as relações entre os conceitos.

domingo, 19 de setembro de 2010

Visão geral das ontologias aplicadas na Ciência da Informação

O presente trabalho é uma compilação de diversos autores e tem por objetivo apresentar uma visão geral sobre ontologia, em sua conceituação, objetivos, características, tipologias e aplicações. E com isso oferecer a área de Ciência da Informação discussões sobre melhorias nas padronizações das ontologias.

Atualmente, as técnicas de organização da informação buscam melhorias no tratamento dos dados, tanto na seleção, como no processamento, e principalmente na recuperação da informação. Elas se organizam através de termos, como os arquivos de autoridade, glossários e dicionários. Outras se organizam com a classificação e criação de categorias, como os cabeçalhos de assuntos e os esquemas de classificação (taxonomia). E outras vão ainda mais além, que se organizam a partir de conceitos e seus relacionamentos, que são as ontologias, os thesaurus e as redes semânticas.
Segundo Gruber (1993, p.18 apud SALES, 2009), a ontologia é definida como uma “especificação formal e explicita de uma conceituação compartilhada”. De acordo com Diniz e Foo (2002, p.123 apud SALES, 2009), além da definição eles ainda procuram explicar o significado de cada termo: (1) Conceituação: “modelo abstrato de um fenômeno no mundo”; (2) Explícita: “tipos de conceitos e suas restrições devem estar explicitamente definidos”; (3) Formal: “a ontologia deve ser processada por máquina” e; (4) Compartilhada: “a ontologia deve capturar o conhecimento aceito por consenso pelas comunidades que delas fazem uso”.

As ontologias tem por objetivo: (1) possuir conceituações compartilhadas, elas devem possuir um vocabulário estruturado com termos, definições e relacionamentos que devem expressar um acordo comum entre seus usuários; (2) ser descritas através de axiomas lógicos, na qual suas definições devem possuir uma forma padrão baseadas e determinar a verdade das sentenças e; (3) ser processáveis por máquina, para ter uma linguagem formal que possibilite a interpretação desse vocabulário.
Para Gruber (1993, p.18 apud ALMEIDA, 2003), as ontologias não apresentam sempre a mesma estrutura, mas existem características e componentes básicos comuns presentes na maioria delas, os principais são: (1) classes: organizadas em uma taxonomia; (2) relações: representam o tipo de interação entre os conceitos de domínio; (3) axiomas: usados para modelar sentenças sempre verdadeiras; e (4) instâncias: utilizadas para representar elementos específicos (os próprios dados).

Segundo Almeida (2003), existem inúmeras tipologias na literatura e algumas são conflitantes, por exemplo: (1) natureza da ontologia: reuniu-se as ontologias de domínio e as ontologias de tarefa; (2) grau de formalismo de seu vocabulário: reuniu-se as ontologias informais, linguisticas/terminológicas, ontologias semi-informais, ontologias formais e ontologias rigorosamente formais; (3) função e; (4) estrutura e conteúdo de conceitualização. Mesmo sem consenso,os tipos de ontologias apresentam semelhanças entre suas funções, conhecendo os tipos e características,pode-se determinar ontologias existentes adequadas para a utilização desejada.
As ontologias são aplicadas em projetos de domínio como Gestão do Conhecimento, Comércio eletrônico,processamento de linguagem naturais, recuperação da informação na Web, de cunho educacional, para empresas, entre outros.

Assim, a importância das ontologias para a área da Ciência da Informação é fundamental para a recuperação nas áreas de domínio. Portanto, cabe aos profissionais da informação avaliar a melhor forma de melhorais na padronização das ontologias.

REFERÊNCIAS
ALMEIDA, Mauricio B.; BAX, Marcello P. Uma visão geral sobre ontologias: pesquisa sobre definições, tipos, aplicações, métodos de avaliação e de construção. Revista Ciência da Informação, Brasília, v.32, n.3, p.7-20, set./dez. 2003.

SALES, Luana Farias; CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha. Ontologias de domínio: um estudo das relações conceituais e sua aplicação. VII ENANCIB Encontro Nacional de Pesquisa em Ciência da Informação, 19-22 nov. 2006, Salvador, Bahia. Disponível em: http://www.portalppgci.marilia.unesp.br/enancib/viewpaper.php?id=205. Acesso em: 23 mar. 2009

quinta-feira, 16 de setembro de 2010

Gestão de Conteúdo em Portais Corporativos

Hoje acontecerá uma palestra do Prof. Charlley na disciplina de Gestão de Conteúdo sobre Portais Corparativos.

sexta-feira, 10 de setembro de 2010

Política de Governança

Portais, sites, blogs corporativos vivem assumbrados pelo fantasma da colaboração.
Quando existe, garanto que foi uma conquista, a questão da padronização fica devendo, e temos os casos de falta de colaboração por diversos motivos que devem ser analisados.

Para começar a conversar sobre isto leiam os artigos do Fernando Viberti:

Política de Governança, estrutura miníma

 Política de Governança, elaborando a política.

quarta-feira, 8 de setembro de 2010