Gerência de Sistemas e Serviços de Informação

terça-feira, 5 de outubro de 2010

Dúvidas sobre empreendedorismo? Não mais...

No portal coorporativo do SEBRAE/SP (http://www.sebrae.com.br/) você encontra informações úteis, para idealizar, iniciar ou melhorar seu negócio. Com linguagem simples e a disponibilização de diferentes recursos, esse portal é um ótimo exemplo da gestão de conteúdo bem administrada.

Afinal o que é biblioteca digital?

Com um texto bem fundamentado, o autor aborda as diferentes visões e definições de biblioteca digital. Utilizado de maneira ampla o termo biblioteca digital, é empregado tanto para designar a forma de acesso até a maneira como a informação está armazenada.

Diversos autores vêem a biblioteca digital como um paradigma, alguns até prevendo o desaparecimento do suporte analógico, mas, o que fica claro nesse texto é que mesmo sendo digital, ainda é uma biblioteca. O que nos remete à questão da função das bibliotecas.

Atualmente, a tecnologia existente mudou a maneira como as bibliotecas cumprem sua principal função, a de conectar as pessoas com a informação. Mas, a função permanece a mesma, só a maneira de como isso é feito, de como a informação é guardada, de como é feita a busca e o acesso foi que mudou.

Assim como o cinema não substituiu o rádio, nem esse foi substituído pela TV, as bibliotecas digitais vêm para agregar e ajudar a difundir a razão de sua existência: disseminar a informação, seja qual for o meio.

Biblioteca digital é um marco na evolução das bibliotecas, que rapidamente se tornam locais híbridos de acesso à informação e ao conhecimento, para onde convergem e se integram todos os tipos de meios.

Finalmente, isto ressalta a importância do profissional bibliotecário, que deve estar cada vez mais preparado para enfrentar os desafios das integrações de mídia e uso de novas tecnologias. Você está pronto?

SAYÃO, Luis Fernando. Afinal, o que é biblioteca digital? REVISTA USP, São Paulo, n.80, p. 6-17, dezembro/fevereiro 2008-2009.

Recuperação de informação baseada em clusters

ABDALA, Carmen Verônica Mendes; Andrade, Vinícius Antônio de. Recuperação de informação baseada em clusters. Revista USP. São Paulo, n.80, p.50-61. Dez/fev 2008-2009.

Os buscadores ainda são imprescindíveis para a busca e recuperação da informação. Eles nasceram logo após o aparecimento da internet com o objetivo de coletar, organizar e mostrar os resultados da pesquisa de forma rápida e eficiente. Atualmente há uma infinidade de buscadores, tais como: Google, Cadê, Yahoo entre outros. Todos eles têm suas próprias regras para avaliar a relevância dos sites que indexa, e essa e essa relação de relevância pode ser mais bem elaborada através do esforço de quem cria o site. E neste momento que entram os padrões web, as boas práticas de desenvolvimento que permite criar uma melhor relação entre a informação compartilhada e consumida por usuários e por máquinas (como os mecanismos de busca) com meta-informação, consumida principalmente por máquinas (robôs de buscas), mas que foram criadas para serem eficientes para pessoas.

A recuperação é feita por aranhas ou web crawlers que são programas que navegam pela Internet independentemente indexando cada palavra-chave que encontram no hipertexto das páginas que analisam. Depois de indexada toda página se movem para todas as demais páginas referidas (linked) pela página indexada, reiniciando o processo a cada nova página. A função primordial das aranhas é analisar e indexar toda a Internet. São, portanto, neutras com relação ao conteúdo que analisam. Estes robôs criam os bancos de dados sobre os quais funciona grande parte dos mecanismos de buscas. Quando as aranhas buscam suas informações não aleatoriamente pelas páginas da Internet, mas por meio de consultas a outros mecanismos de buscas, dizemos que se trata de uma meta-aranha ou mecanismo de meta-busca.

Atualmente há um esforço enorme dos arquitetos de informação em organizar para o usuário no site de forma que ele fique fácil de usar e fácil de encontrar a informação que ele precisa. Em alguns casos o arquiteto de informação participa também da criação de tesauros e/ou ontologias para relacionar a informação dentro de domínios específicos de significado e as relações entre estes. E isso tudo para melhorar a encontrabilidade (findability) da informação em um web site. Isso é chamado de meta informação.

Como os buscadores são mais fáceis e ágeis para a busca e recuperação da informação, as bases de dados estão implantando recursos que permitem a apresentação dos resultados por relevância e clusterização que são tendências importantes que facilitam o encontro da informação. A clusterização é uma arquitetura que permite a classificar objetos de diferentes grupos ou a partição de um conjunto de dados em subgrupos (cluster).

A Biblioteca Virtual em Saúde (BVS) adotou em sua coleção de fontes de informação a possibilidade de ver os resultados de forma integrada, individualizada e ordenada por diferentes critérios e clusters. Este recurso permite que o usuário reduza o numero de interações para se obter o resultado final através de otimização de recursos como a redução de cliques ou menus e modelo de arquitetura compatível com os principais buscadores da internet.

segunda-feira, 4 de outubro de 2010

A informação Documentária: codificação e decodificação

A sociedade tem buscado adquirir conhecimento, seja qual for o seu segmento, e dentro dessa busca e aquisição que o individuo tem encontrado, a grande preocupação é a forma que o conhecimento e a informação será guardada, para que assim, as futuras gerações possam ter acesso e recuperar o mesmo.

Dentro dessa necessidade de guarda, Profissionais na àrea de Biblioteconomia tem destacado o seus conhecimentos técnicos, e dentro da área de atuação, tem inserido a informação e recuperado, dessa forma, usuários tem acessado e tem visto a sua informação guardada de uma forma segura. Um grande destaque para esses profissionais recuperarem tal informação e conhecimento é a utilização de Sistemas de Classificação. Dentre os vários Sistemas de Classificação existentes, entre eles, CDD, CDU, LC entre tantos outros, pode-se destacar o Tesauros , que é "uma Linguagem documentária controlada, dinâmica e estruturada, semântica e hierarquicamente, que cobre um campo especifico ou todos os campos do conhecimento" e que tem como principal objetivo a difusão da Linguagem Documentária e o controle dos termos utilizados na representação do conhecimento.

Os termso utilizados no Tesauros são a base para a estruturação do conhecimentos nas linguagens especializadas e serve de referência para os descritores das linguagens documentárias.

A principal caracteristica da Linguagem Documentária é a inserção dos termos, idéias e conceitos em classes categoriais, facilitando assim, o entendimento, a busca, e a recuperação do conhecimento que o usuário necessita. A sua estrutura assim como na Linguagem Natural necessita de definições nos campos lexicais e semânticos de uma área do conhecimento, na ausência de definições e padrões a recuperação do conhecimento será comprometida

quinta-feira, 30 de setembro de 2010

A Web Semântica e suas contribuições para a ciência da informação

SOUZA, R. R; ALVARENGA, L. A Web Semântica e suas contribuições para a ciência da informação. Ciência da Informação, v. 33, n. 1, 2004. Disponível em: < http://revista.ibict.br/index.php/ciinf/article/view/50/49 > . Acesso em: 29 set. 2010.

O artigo trata do processo de atualização pelo qual passa a World Wide Web na sua transição para a chamada Web Semântica. Os autores buscam identificar as tecnologias, organizações e conceitos associados a essa nova web. E também mostram a relação da web semântica com a ciência da informação.

A web semântica não é uma web separada, sendo uma extensão da atual, um melhoramento dessa mesma web que foi criada para implantar o conceito de hipertexto, oferecendo interfaces amigáveis e intuitivas para facilitar o acesso ao imenso repositório que é a Internet.

A recuperação da informação é o que busca a Web Semântica. Os autores fazem a analogia com as tecnologias de recuperação da informação usados na documentação, biblioteconomia e na ciência da informação. Os sistemas de recuperação da informação passaram a ser mais necessários com o boom informacional e como a web passou a ser um crescente repositório de informação se faz necessário o uso de ferramentas mais adequadas para facilitar o acesso às informações nela armazenadas, como o uso de indexação e descritores, a aplicação de um vocabulário uníssono, para criar um ambiente de trocas.

O World Wide Web Consorttium (W3C) projetou a Web Semântica para embutir inteligência e contexto nos códigos XML (eXtensible Markup Language). usados na web visando uma melhoria de interação entre os programas usados e possibilitar uma utilização mais intuitiva. O W3C recomenda padrões para uso na web, como a linguagem XML, o Dublin Core e o RDF, para se obter mais interoperabilidade na web.

O XML foi recomendado para a construção de documentos a serem exibidos no computador que possui um conjunto de DTD, que são tags, marcações para a descrição dos dados e comandos desses documentos e por ser uma flexível permitindo que o criador do documento web adicione novas tags.

O Dublin Core foi recomendado como uma padronização dos metadados usados nas tags do XML uma vez que não basta só ter os metadados eles precisam ser unanimes e inteligíveis para se evitar a ambigüidade, pois não há muita diferença no âmbito da web entre as tags e . O Dublin Core é composto de 15 elementos de metadados (title, creator, subjetc, description, Publisher, contributors, date, type, format, identifier, source, language, relation, coverage e rights), sendo ele uma iniciativa para criação de um vocabulário controlado para uso na web.

O RDF (Resource Descriptions Framework) é mais uma recomendação do W3C que encerra uma padrão de ontologias para descrição de recursos de Internet. O RDF estabelece um padrão de metadados a serem embutidos na codificação XML, onde os metadados são descritos em “triplas” de recursos – propriedade – valor que forma uma corrente de acesso aos padrões de metadados (namespace) como o Dublin Core. Os namespaces, as ontologias e o padrão RDF vão permitir que qualquer um publique informações na web de forma que os produtos de software ou agentes possam interpretar e agir semanticamente sobre essa informação marcada de maneira inteligente, pois com o RDF se tem uma sintaxe padrão para a descrição dos recursos da web. O RDF ainda é uma evolução e se estudam soluções para os namespaces, assim as ontologias estão sendo estudadas e criadas de maneira compartilhada para agir como namespaces mais genéricos.

As ontologias se aproximam dos conceitos de tesauros e vocabulários controlados, pois no contexto da web semântica, dentro da ciência da informação as ontologias vão descrever as relações entre termos e seus conceitos, criando um vocabulário compartilhado para trocar informações. Diversos padrões estão sendo desenvolvidos para a construção e compartilhamento das ontologias como o DAML+OIL (DARPA Agent Markup Language) que é uma linguagem baseada no XML que possui mais capacidade na descrição de objetos e no seu relacionamento, para expressar semântica e criar alto grau de interoperabilidade entre sites da web.

A web semântica pode ser vista como um grande sistema de recuperação de informações. Sendo as ferramentas e tecnologias de anotação semântica das páginas web para construção de ontologias compartilhadas, como a indexação e representação dos documentos. Essas ferramentas permitirão a existência de paginas web marcadas semanticamente com metadados que permitirão aos motores de busca um uso mais significativo da informação na web, através agentes (programas) que rastreiem e coletem os dados de forma automática usando um certo nível de “compreensão” dos seus conteúdos de modo que a informação recuperada seja mais significativamente pelos usuários, daí um paralelo ente revocação e precisão no resultado de busca.

Com a web semântica se vislumbra: a construção de novas linguagens e formas artificiais de indexação automática, a construção de novas interfaces com o usuário, usando sistemas de informação mais intuitivos e coerentes e o uso de mapas conceituais de acordo com o perfil do usuário. Outra promessa é a construção automática de tesauros e vocabulários controlados, que partiria das marcações semânticas dos documentos e das relações tríplices do RDF, recurso - propriedade - valor. A indexação automática dos documentos por meio das ontologias e a gestão do conhecimento de forma geral com o uso dessas tecnologias.

A web semântica é uma promessa muito discutida e aguardada, pois quando aplicada em plenitude trará um ganho imenso para os usuários e para os que trabalham com a gestão de conteúdos, facilitando o armazenamento, a troca, a localização, o acesso, a disseminação e o gerenciamento da informação.

quarta-feira, 29 de setembro de 2010

Fundamentos da organização frente à produção de documentos.

A referência a produção de documentos não está aqui indicando a produção intelectual ou artística de seu conteúdo (obra do autor), mas a produção de formas de apresentação e de representação da obra, assim como de seus pontos de acesso em sistemas de informação documentária. Refere-se ao documento como uma forma de apresentação e como um conjunto sugerido de informações documentárias, e não como o conhecimento nele contido.

As informações documentárias são entendidas como aquelas apreendidas, registradas e armazenadas em sistemas de informação documentária de modo que sejam passíveis de recuperação e uso.

Segundo Scarpit citado por Couzinet, Regimbeau e Corbières (2001), as referências contêm não a informação propriamente, mas a designação do documento que contém a informação e a referência bibliográfica, o registro catalográfico e a ficha descritiva são etiquetas que permitem atestar a existência de um documento. O documento é uma prova e a menção de um documento é uma prova de que esse documento existe: é a prova da prova.

Torna-se dificil recuperar a fonte de referência quando são mal redigidas ou incompletas porque aquelas repousam sobre princípios de caracterização que devem ser respeitados para que o vinculo entre essas duas entidades etiquetas e documentos não seja rompido.

É possível notar que existe um grande avanço no que se refere à organização do conteúdo, mas necessitamos desenvolver e aprimorar teorias e métodos sobre a representação descritiva.

Concluímos pela noção de produção de documentos, no sentido documentário, como aquela realizada em um sistema de informação documentária, por meio da transformação do texto do autor em documento, o que implica na elaboração de formas de apresentação, representação e acesso a esses documentos.

ORTGEA, Cristina Dotta. Fundamentos da organização frente à produção de documentos. TransInformação, Campinas, 20(1): 7-15, jan./abr., 2008. Disponível em: http://revistas.puc-campinas.edu.br/transinfo/viewarticle.php?id=196. Acesso em 25 set. 2010.

sábado, 25 de setembro de 2010

Governança de Conteúdo

Para garantir que um Portal Corporativo atenda seus objetivos, não basta utilizarmos as melhores ferramentas de tecnologia da informação e comunicação. Através da gestão de processos, deve-se estabelecer um conjunto de diretrizes e procedimentos que sistematizem a gestão de seus conteúdos, ou seja, a Governança de Conteúdos deste Portal.

O estabelecimento da política de governança deve ser iniciado no início do processo de desenvolvimento do portal apresentando seus objetivos, utilização, mecanismos de controles quando a percepção de seus usuários e regras de negócios da organização. Ao ser concluído deve ser amplamente divulgado para todos os envolvidos.

Através de diagnóstico desenvolvido em cada setor da empresa ou instituição, quanto as necessidades de conteúdos a serem disponibilizados, inicia-se o processo da Política de Governança. Com estes dados será ser estabelecido o “fluxo das informações” de cada área da organização.

Entre os princípios na elaboração desta política deve-se observar principalmente, a transparência e atualização dos assuntos, padronização das diretrizes e verificação contínua quanto ao cumprimento das metas e objetivos planejados para o portal.

Alguns itens são essenciais neste documento: instruções e padronizações de layout e conteúdo, matriz de responsabilidades, indicação de autoridade para aprovação dos conteúdos, confiabilidade das informações, responsável pelo suporte e periodicidade das atualizações. Outro fator fundamental é o envolvimento de todos com o portal, motivando o comprometimento das pessoas.

Finalmente deverão ser esclarecidos e explicitados neste documento os critérios de segurança entre eles, a forma de relacionamento com terceiros que interagem com o portal, os critérios de privacidade quanto ao compartilhamento de informações e os direitos de uso e propriedade dos conteúdos e imagens (Lei de Direito Autoral - Lei nº 9.610, de 19/02/1998).

Salienta-se que a Política de Governança de um Portal Corporativo deve ser constantemente monitorada e modificada conforme sua evolução.

VIBERTI, Fernando. Política de governança: estrutura mínima. Disponível em: http://intranetportal.org.br/wp/2005/03/politica-de-governanca-estrutura-minima/. Acesso em 24.09.2010.
VIBERTI, Fernando. Governança de conteúdo: elaborando a política. Disponível em: http://intranetportal.org.br/wp/2005/02/governanca-de-conteudo-elaborando-a-politica/ Acesso em: 25.09.2010.

quinta-feira, 23 de setembro de 2010

RESENHA - Mapa conceitual

LIMA, G.A.B. Mapa conceitual como ferramenta para a organização do conhecimento em sistema de hipertexto e seus aspectos cognitivos. Belo Horizonte, Perspectiva em Ciência da Informação, v.9,n.2,p.134-135,jul./dez. 2004.

Desenvolvidos por Novak e Hanesian e proposto por Ausubel como forma de instrumentalizar a teoria da aprendizagem significativa do mesmo. Os mapas conceituais são como diagramas que relacionam conceitos segundo uma ordem hierárquica por meio de palavras ou símbolos inseridos dentro de círculos, retângulos etc. Para seu entendimento e ou construção é preciso que o aprendiz tenha um conhecimento prévio do assunto a fim de associá-los e estruturá-los em uma ordem que mantenha relações entre o conteúdo de cada balão.

A construção de mapas nos permite compreender como ocorre a organização da informação, baseando-se na interpretação, comparação e síntese oferecidas, conseqüentemente nos permite conhecer como o conhecimento é organizado e construído.

O mapa conceitual, como componente da navegação hipertextual, é a técnica de representar conhecimento em forma gráfica, construindo uma rede de conhecimento constituída de nodos e links, nos quais os nodos representam os conceitos e os links representam as relações entre os conceitos.

domingo, 19 de setembro de 2010

Visão geral das ontologias aplicadas na Ciência da Informação

O presente trabalho é uma compilação de diversos autores e tem por objetivo apresentar uma visão geral sobre ontologia, em sua conceituação, objetivos, características, tipologias e aplicações. E com isso oferecer a área de Ciência da Informação discussões sobre melhorias nas padronizações das ontologias.

Atualmente, as técnicas de organização da informação buscam melhorias no tratamento dos dados, tanto na seleção, como no processamento, e principalmente na recuperação da informação. Elas se organizam através de termos, como os arquivos de autoridade, glossários e dicionários. Outras se organizam com a classificação e criação de categorias, como os cabeçalhos de assuntos e os esquemas de classificação (taxonomia). E outras vão ainda mais além, que se organizam a partir de conceitos e seus relacionamentos, que são as ontologias, os thesaurus e as redes semânticas.

Segundo Gruber (1993, p.18 apud SALES, 2009), a ontologia é definida como uma “especificação formal e explicita de uma conceituação compartilhada”. De acordo com Diniz e Foo (2002, p.123 apud SALES, 2009), além da definição eles ainda procuram explicar o significado de cada termo: (1) Conceituação: “modelo abstrato de um fenômeno no mundo”; (2) Explícita: “tipos de conceitos e suas restrições devem estar explicitamente definidos”; (3) Formal: “a ontologia deve ser processada por máquina” e; (4) Compartilhada: “a ontologia deve capturar o conhecimento aceito por consenso pelas comunidades que delas fazem uso”.

As ontologias tem por objetivo: (1) possuir conceituações compartilhadas, elas devem possuir um vocabulário estruturado com termos, definições e relacionamentos que devem expressar um acordo comum entre seus usuários; (2) ser descritas através de axiomas lógicos, na qual suas definições devem possuir uma forma padrão baseadas e determinar a verdade das sentenças e; (3) ser processáveis por máquina, para ter uma linguagem formal que possibilite a interpretação desse vocabulário.

Para Gruber (1993, p.18 apud ALMEIDA, 2003), as ontologias não apresentam sempre a mesma estrutura, mas existem características e componentes básicos comuns presentes na maioria delas, os principais são: (1) classes: organizadas em uma taxonomia; (2) relações: representam o tipo de interação entre os conceitos de domínio; (3) axiomas: usados para modelar sentenças sempre verdadeiras; e (4) instâncias: utilizadas para representar elementos específicos (os próprios dados).

Segundo Almeida (2003), existem inúmeras tipologias na literatura e algumas são conflitantes, por exemplo: (1) natureza da ontologia: reuniu-se as ontologias de domínio e as ontologias de tarefa; (2) grau de formalismo de seu vocabulário: reuniu-se as ontologias informais, linguisticas/terminológicas, ontologias semi-informais, ontologias formais e ontologias rigorosamente formais; (3) função e; (4) estrutura e conteúdo de conceitualização. Mesmo sem consenso,os tipos de ontologias apresentam semelhanças entre suas funções, conhecendo os tipos e características,pode-se determinar ontologias existentes adequadas para a utilização desejada.

As ontologias são aplicadas em projetos de domínio como Gestão do Conhecimento, Comércio eletrônico,processamento de linguagem naturais, recuperação da informação na Web, de cunho educacional, para empresas, entre outros.

Assim, a importância das ontologias para a área da Ciência da Informação é fundamental para a recuperação nas áreas de domínio. Portanto, cabe aos profissionais da informação avaliar a melhor forma de melhorais na padronização das ontologias.

REFERÊNCIAS

ALMEIDA, Mauricio B.; BAX, Marcello P. Uma visão geral sobre ontologias: pesquisa sobre definições, tipos, aplicações, métodos de avaliação e de construção. Revista Ciência da Informação, Brasília, v.32, n.3, p.7-20, set./dez. 2003.

SALES, Luana Farias; CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha. Ontologias de domínio: um estudo das relações conceituais e sua aplicação. VII ENANCIB Encontro Nacional de Pesquisa em Ciência da Informação, 19-22 nov. 2006, Salvador, Bahia. Disponível em: http://www.portalppgci.marilia.unesp.br/enancib/viewpaper.php?id=205. Acesso em: 23 mar. 2009

quinta-feira, 16 de setembro de 2010

Gestão de Conteúdo em Portais Corporativos

Hoje acontecerá uma palestra do Prof. Charlley na disciplina de Gestão de Conteúdo sobre Portais Corparativos.

Gerência de Sistemas e Serviços de Informação - Gestão de Conteúdo