inteligência artificial generativa pretende virar a Internet tradicional de cabeça para baixo. E ele quer fazer isso rapidamente; Para descobrir, basta fazer uma rápida pesquisa no Google. Se antes você tinha que acessar páginas da web para resolver algum problema, agora em muitos … Às vezes, o próprio mecanismo de busca resolve esse problema para você com uma resposta coletada no topo da página e criada com inteligência artificial treinada em dados de todos os cantos da web. E se você quiser apostar tudo, o ChatGPT também está lá. OU Gêmeos. ou Grok. O surgimento de robôs capazes de responder a todas as perguntas já está afetando muitas páginas, cuja sustentabilidade depende do número de visitas. E WikipédiaA maior coleção de conhecimento humano digital já criada, contendo mais de 60 milhões de artigos e disponível em mais de 300 idiomas, não é exceção.
O espaço, um dos mais visitados da Internet nos seus quase 25 anos de história, funciona há muitos anos como uma espécie de contentor online que pode acomodar quase todos os temas imagináveis: do mastim espanhol à lei da gravidade ou à pintura barroca. Mas isso não significa que esteja imune às mudanças que acontecem na Internet. Recentemente o fundo Wikimediaa organização sem fins lucrativos que mantém e mantém a Wikipedia compartilhou um comunicado dizendo que a enciclopédia digital perdeu 8% de seu tráfego humano em apenas um ano. O principal motivo? IA.
“A Wikipedia sempre esteve em primeiro ou segundo lugar nos resultados de pesquisa do Google quando você pesquisava algo. Agora o Google mostra os resultados de sua própria IA, e a maior parte do tráfego fica feliz com o que é informado. Ele não vai mais longe e não rola. Se a IA já está lhe dizendo o que você está procurando, por que você vai visitar outro site? “Uma queda de 10% no tráfego pode não parecer muito séria. Mas deve-se ter em mente que a Wikipédia sobrevive das doações que recebe da comunidade; se o número de usuários cai, essas doações caem, e também cai o número de wikipedistas que são responsáveis, em última análise, por escrever e editar artigos.” voluntariamente”, conclui.
Grokipédia
Os problemas da Wikipédia com a IA não terminam com uma queda nas visitas. Em novembro passado, a Wikimedia publicou uma publicação na qual apelava diretamente às empresas envolvidas no desenvolvimento de inteligência artificial, pedindo cooperação financeira com o projeto. No entanto, a fundação lembrou também que “a IA se baseia em recursos de conhecimento documentados por pessoas, como a Wikipédia”, e que este site é um dos mais utilizados pelas empresas de desenvolvimento de software para obter informação para treinar as suas máquinas. Porque nenhum dos chatbots atualmente na Internet saberia responder às perguntas que lhes são feitas, a menos que sejam primeiro treinados em dados gerados por humanos. Para o aprendizado de máquina, a enciclopédia digital é um tesouro.
Os autores da Wikipédia já precisam garantir que o conteúdo gerado pela IA não seja compartilhado na enciclopédia.
“Em muitos casos, esses aplicativos estão regurgitando a Wikipédia, e não acho que seja do interesse deles deixar o site cair porque eles terão que fazer acordos com outras pessoas para obter todas essas informações geradas por humanos para treinar suas máquinas”, diz Garcia.
Talvez o melhor exemplo da dependência da IA na Wikipédia possa ser encontrado na Grokipedia de Elon Musk, um espaço lançado em 28 de outubro que pretende funcionar como uma espécie de alternativa ao conteúdo gerado pela IA de Grok. O problema é que dos milhões de artigos que contém, muitos, talvez até a maioria, foram literalmente copiados da Wikipédia.
“Partilhamos conhecimento de forma livre e transparente com a comunidade, esta ferramenta (Grokipedia) parece estar mais alinhada com os objetivos pessoais”, diz Matilde Cuadro, sócia da Wikimedia Espanha, a este jornal, referindo-se ao preconceito favorável da nova enciclopédia alimentada por IA em relação a Musk e aos postulados que defende. Algo para o qual vários investigadores já alertaram. Cuadrado também aponta que “quase todos os principais modelos de IA usam a Wikipédia porque ela gera conteúdo de alta qualidade e não é fácil remover tudo o que a IA sabe da Wikipédia”.
Artigos copiados
A enciclopédia também está muito preocupada que seus artigos acabem cheios de conteúdo gerado por IA. A plataforma atualmente permite que os wikipedistas usem a tecnologia para acelerar seu trabalho, embora todos os artigos publicados devam ser criados por humanos. “Já estão aparecendo novos editores que vêm com textos obviamente muito complexos que você entende imediatamente que foram criados usando IA. Isso preocupa muitos membros da comunidade porque as diretrizes da Wikipédia exigem que todos os textos carregados sejam confiáveis e verificáveis através de fontes citadas”, diz Garcia.
O especialista ressalta que é o conteúdo criado por máquinas como o ChatGPT que não é verificável: “Muitas vezes eles não dizem onde conseguiram as informações que compartilham e, às vezes, eles próprios as inventam”. Felizmente, ele observa que, na maioria dos casos, é fácil detectar quando alguém está tentando fazer passar um artigo gerado por IA como se fosse seu; É uma questão de conseguir “identificar o fedor do ChatGPT”: “Quem já usou um chatbot sabe que as máquinas tendem a seguir uma estrutura mais ou menos lógica nas suas respostas. Primeiro apresentam o problema, depois desenvolvem-no, e no final dão sempre algum tipo de conclusão, como: “Este é o problema fundamental para a compreensão do século XX”, e estas são frases típicas que a IA deixa por todo o lado.
Garcia também observa que os chatbots, quando tentam criar verbetes no mesmo formato da Wikipédia, não medem esforços para se adaptar ao que é habitual na enciclopédia: “Por exemplo, para uma pessoa que se tornou famosa recentemente, geralmente é o caso de sua entrada na Wikipédia ser geralmente mais curta. Quando eles tentam entregar a você um arquivo que tem muitas seções e muito texto, é provável que tenha sido criado pela IA porque, como já descobrimos, é isso que as máquinas normalmente fazem.