Pular para o conteúdo

Inteligência Artificial pode aumentar a confiabilidade da Wikipédia

Inteligência Artificial pode aumentar a confiabilidade da Wikipédia

Existem opiniões divergentes suficientes sobre a utilidade da Wikipedia para preencher, bem, uma enciclopédia.

O romancista Nicholson Baker chamou a Wikipedia, um compêndio de dados que seus desenvolvedores chamam de coleção de todo o conhecimento do mundo, “simplesmente uma coisa incrível. É enorme em termos de fatos e é idiossincrático, cuidadoso, confuso, engraçado, chocante e cheio de controvérsias latentes – e é gratuito e rápido.”

O escritor Oscar Auliq-Ice declarou a Wikipedia “um recurso revolucionário que transformou a forma como as pessoas acessam e compartilham informações”.

Alguns reconhecem o gigantesco recurso online – que nesta semana contém mais de 6,7 milhões de artigos (em inglês) compostos por mais de 4,3 bilhões de palavras – como um empreendimento majestoso, mas falho.

“A Wikipédia é como um canteiro de flores, em sua maioria bonito com algumas ervas daninhas feias”, disse o especialista ambiental Steven Magee.

Observando a natureza coletiva da Wikipédia, que está aberta a qualquer pessoa que forneça informações voluntariamente, o humorista Stephen Colbert sugeriu: “A Wikipédia é o primeiro lugar que vou quando procuro conhecimento… ou quando quero criar algum.”

Para alguns, porém, a Wikipedia é uma pílula amarga. “Não preciso de acesso sem fio à Wikipédia. Prefiro fritar meu próprio intestino delgado do que ter acesso contínuo a um site onde a entrada para Klingon é mais longa do que a entrada para latim”, disse Tara Brabazon, reitora de pós-graduação, e professora de estudos culturais na Universidade Charles Darwin, na Austrália.

Embora geralmente considerada uma fonte de informação louvável e de acesso rápido, os usuários são sempre aconselhados a fazer a devida diligência e a não confiar apenas em uma fonte de informação. Em vez disso, eles deveriam revisar outros sites, explorar links de artigos e, talvez o mais importante, verificar as fontes listadas no final de cada entrada da Wikipédia.

Especialistas de todo o mundo contribuem regularmente para a Wikipédia e a maioria segue diretrizes relativas à neutralidade e ao uso de fontes confiáveis. O sistema geralmente funciona, embora sempre possam ser feitas melhorias.

Esta semana, a Nature Machine Intelligence publicou um artigo intitulado “Melhorando a verificabilidade da Wikipédia com IA”, sobre uma empresa de IA com sede em Londres que busca reforçar a confiabilidade do sistema de referência da Wikipédia. Fá-lo verificando as fontes e identificando as que são precisas e as que são questionáveis ​​e, em seguida, fornecendo as suas próprias recomendações.

Fabio Petroni, cofundador da Samaya AI, uma plataforma de descoberta de conhecimento, disse: “O processo de melhoria de referências pode ser abordado com a ajuda da inteligência artificial alimentada por um sistema de recuperação de informações e um modelo de linguagem. As máquinas podem ajudar os humanos a encontrar citações melhores, uma tarefa que requer compreensão da linguagem e domínio da pesquisa online.”

Sua equipe treinou seu modelo em um enorme conjunto de dados de entradas da Wikipédia e depois o usou para revisar artigos que não haviam sido digitalizados antes. Analisou fontes e ofereceu sites de referência alternativos, e seus resultados foram então examinados por usuários da Wikipédia.

Quando o sistema de IA, chamado SIDE, classificou as fontes da Wikipédia como não verificáveis ​​e ofereceu suas próprias alternativas, os usuários preferiram as recomendações do SIDE 70% das vezes, descobriram os pesquisadores.

Em cerca de metade dos casos, a SIDE recomendou fontes idênticas às que a Wikipédia ofereceu como primeira referência.

“Demonstramos que as tecnologias existentes atingiram um estágio em que podem apoiar de forma eficaz e pragmática os usuários da Wikipédia na verificação de reivindicações”, disse Petroni.

Ele disse que pesquisas futuras se concentrarão nas referências da Wikipédia além dos textos da Internet, como imagens, vídeos e publicações em papel.

“Esperamos que este trabalho possa ser usado num contexto mais amplo… ajudando os humanos a verificar os fatos. De forma mais geral, acreditamos que este trabalho poderá levar a informações online mais fiáveis”, disse Petroni.

 

Traduzido por Mateus Lynniker de Phys.Org

Mateus Lynniker

Mateus Lynniker

42 é a resposta para tudo.