Uma ferramenta para recuperação de tags de blogs baseada em microformatos
Palavras-chave:
Micro Formatos, Blogs, Marcações, Produtos de InformaçãoResumo
O objetivo deste trabalho é apresentar a ferramenta Microgisbone que realiza a recuperação da informação de blogs na Internet utilizando como referência o padrão de microformato rel-tag. A ferramenta proposta tem como princípios (i) a adequação aos padrões de Big Data, (ii) utilizar uma arquitetura de serviços escalável para que seja possível utilizar computação em nuvem a partir de Infraestrutura como Serviços (IaaS) e (iii) que esteja disponível como um serviço de informação a comunidade. Para validar o funcionamento da ferramenta e escolher a arquitetura de dados foi realizado um experimento utilizando um cenário real, blogs hospedados pelo wordpress.com, onde as marcações (tags) foram coletadas por um período de 3 dias. Ao término deste experimento, onde foram coletadas cerca de 6,6 milhões de tags, foram desenvolvidos alguns serviços de informação, baseados nas marcações coletada. Foi observado que, de fato, um volume relativamente grande de informação foi recuperado de uma quantidade pequena de blogs e de um tipo de informação que é pequeno (marcações). Foi observado também padrão rel-tag dos microformatos tornam mais simples a identificação e recuperação das marcações nos blogs por máquinas se comparados com os mecanismos formais de web-semântica.
Downloads
Downloads
Publicado
Como Citar
Edição
Seção
Licença
DIREITOS DE AUTOR: O autor retém, sem retrições, os direitos sobre sua obra.
DIREITOS DE REUTILIZAÇÃO: A TPBCI adota a Licença Creative Commons, CC BY-NC atribuição não comercial conforme a Política de Acesso Aberto ao conhecimento adotado pela ANCIB. Com essa licença é permitido acessar, baixar (download), copiar, imprimir, compartilhar, reutilizar e distribuir os artigos, desde que para uso não comercial e com a citação da fonte, conferindo os devidos créditos de autoria e menção à TPBCI. Nesses casos, nenhuma permissão é necessária por parte dos autores ou dos editores.
DIREITOS DE DEPÓSITO DOS AUTORES/AUTOARQUIVAMENTO: Os autores são estimulados a realizarem o depósito em repositórios institucionais da versão publicada com o link do seu artigo na TPBCI.