Pular para o conteúdo

Os limites da IA generativa na representação do mundo

Representação de IA

Pesquisadores do MIT analisaram como modelos de inteligência artificial generativa (IA), apesar de sua capacidade impressionante de realizar tarefas como escrever poemas ou criar programas de computador, não demonstram uma compreensão coerente do mundo. Esses modelos, baseados em transformers, são treinados para prever palavras subsequentes em textos, mas um estudo recente mostra que eles podem executar tarefas complexas, como fornecer direções quase perfeitas em Nova York, sem formar um mapa interno preciso da cidade.

O estudo revelou que, embora os modelos possam navegar eficazmente em condições normais, seu desempenho cai drasticamente diante de mudanças inesperadas, como ruas fechadas ou desvios. Ao examinar os mapas gerados por esses modelos, os pesquisadores notaram ruas inexistentes que conectam cruzamentos distantes de forma irrealista, indicando que os modelos não possuem uma representação fiel do ambiente. Isso tem implicações preocupantes para a aplicação prática da IA, pois tarefas que parecem funcionar bem em certos contextos podem falhar em cenários ligeiramente diferentes.

IA ainda não compreende o mundo adequadamente
A imagem ilustra como um sistema pode apresentar estados visivelmente distintos, mas indistinguíveis para um modelo baseado em sequências, destacando os limites de compreensão implícita em sistemas de IA. Detalhes: À esquerda, uma representação visual de um limite Myhill-Nerode e interior. À direita, exemplos de dois estados para Connect-4 cumulativo. Ambos os estados têm o mesmo conjunto de próximos movimentos válidos. A sequência mais curta no limite Myhill-Nerode tem comprimento 4, e o limite contém sequências de até comprimento 30. O interior contém aproximadamente 8,8 × 10 27 sequências de comprimento 29 que não distinguem os dois tabuleiros. Crédito: arXiv (2024). DOI: 10.48550/arxiv.2406.03689

 

Para avaliar se esses modelos formam uma compreensão coerente do mundo, os pesquisadores desenvolveram duas novas métricas: distinção de sequência e compressão de sequência. A distinção avalia a capacidade de um modelo de reconhecer diferenças entre estados distintos, enquanto a compressão verifica se o modelo reconhece que estados idênticos compartilham os mesmos próximos passos possíveis. Usando essas métricas, os pesquisadores testaram a habilidade de modelos baseados em transformers em resolver problemas como navegação urbana e o jogo de tabuleiro Othello.

Os testes mostraram que modelos treinados com dados aleatórios formaram representações do mundo mais precisas do que aqueles treinados com estratégias estruturadas. Isso ocorre porque a aleatoriedade expõe o modelo a uma gama mais ampla de possibilidades. Apesar disso, nenhum dos modelos testados conseguiu formar um modelo coerente do mundo em todas as situações avaliadas, especialmente na navegação urbana, onde desvios simples causaram uma queda acentuada no desempenho.

Ao investigar os mapas criados pelos modelos, os pesquisadores encontraram representações fantasiosas de Nova York, com ruas imaginárias cruzando o grid urbano e orientações impossíveis. Esses resultados mostram que, embora os modelos possam executar tarefas complexas, isso não significa que compreendem as regras subjacentes. Para desenvolver IAs que capturem modelos precisos do mundo, os cientistas precisam adotar abordagens diferentes.

Representação de IA
Figura 3: Mapas reconstruídos de Manhattan a partir de sequências produzidas por três modelos: o modelo real do mundo (à esquerda), o modelo real do mundo com ruído adicionado (no centro) e um modelo de transformer treinado em caminhadas aleatórias (à direita). As arestas saem dos nós na direção cardeal especificada. Nas imagens ampliadas, as arestas que pertencem ao grafo real são pretas, enquanto as arestas falsas, adicionadas pelo algoritmo de reconstrução, são vermelhas.

 

No futuro, os pesquisadores pretendem ampliar a análise para problemas com regras parcialmente conhecidas e aplicar essas métricas em cenários científicos do mundo real. Eles destacam a importância de questionar suposições sobre a capacidade da IA de compreender o mundo, evitando confiar apenas na intuição para avaliar o desempenho dos modelos.

Brendon Gonçalves

Brendon Gonçalves

Sou um nerd racionalista, e portanto, bastante curioso com o que a Ciência e a Filosofia nos ensinam sobre o Universo Natural... Como um autodidata e livre pensador responsável, busco sempre as melhores fontes de conhecimento, o ceticismo científico é meu guia em questões epistemológicas... Entusiasta da tecnologia e apreciador do gênero sci-fi na arte, considero que até mesmo as obras de ficção podem ser enriquecidas através das premissas e conhecimentos filosóficos, científicos e técnicos diversos... Vida Longa e Próspera!