Estudo Revela Falhas em IAs do GPT-4, GPT-5 e Gemini-2.5 Flash

Estudo aponta falhas em IAs como GPT-4, GPT-5 e Gemini-2.5-Flash. Pesquisadores da Microsoft e Arizona testam Magentic Marketplace, revelando limitações em IAs.

06/11/2025 10:14

2 min de leitura

Estudo Revela Falhas em IAs do GPT-4, GPT-5 e Gemini-2.5 Flash
(Imagem de reprodução da internet).

Novos Desafios na Inteligência Artificial: Estudo Revela Falhas em Modelos de IA

Pesquisadores da Microsoft e da Universidade Estadual do Arizona lançaram recentemente um novo ambiente de simulação, chamado Magentic Marketplace, para avaliar o desempenho de agentes de inteligência artificial. Paralelamente, uma pesquisa identificou vulnerabilidades significativas em modelos de IA de ponta, incluindo o GPT-4o e GPT-5, ambos da OpenAI, e o Gemini-2.5-Flash, do Google.

O estudo foca na capacidade desses agentes de operar de forma eficiente em cenários não supervisionados, questionando as expectativas recentes sobre o potencial dos “agentes” de IA.

Simulação de Mercado Digital Revela Limitações dos Agentes

O Magentic Marketplace simula um ambiente de mercado digital onde agentes “clientes” tentam realizar pedidos, como encomendar um jantar. Inicialmente, 100 representantes de consumidores interagiram com 300 empresários em diversas situações de negociação e tomada de decisão.

Leia também:

Os testes iniciais demonstraram que os modelos de IA apresentaram dificuldades em lidar com estímulos variados, sendo suscetíveis a técnicas de persuasão utilizadas pelos agentes “comerciantes” para influenciar suas escolhas e promover a venda de produtos.

Dificuldades na Tomada de Decisão e Colaboração

A pesquisa apontou que a eficiência dos modelos de IA diminui quando confrontados com um grande número de opções de escolha. Segundo Ece Kamar, diretora do AI Frontiers Lab da Microsoft, o objetivo principal é compreender como os agentes de IA lidam com negociações e colaboração.

A equipe busca determinar se essas IAs têm o potencial de transformar o mundo, e, para isso, é crucial entender profundamente como essa transformação ocorrerá.

Código Aberto para Novos Estudos

A plataforma Magentic Marketplace é disponibilizada com código aberto, o que permite que outros grupos repliquem os experimentos ou desenvolvam novos estudos sobre o comportamento emergente desses sistemas. A pesquisa também identificou problemas críticos em tarefas colaborativas, onde os agentes de IA não conseguiam se organizar sozinhos para alcançar um objetivo comum, gerando confusão sobre a atribuição de funções.

A equipe ressalta que a capacidade de colaboração deveria ser inerente aos modelos de IA, melhorando quando instruções explícitas eram fornecidas.

Aqui no ZéNewsAi, nossas notícias são escritas pelo José News! 🤖💖 Nós nos esforçamos para trazer informações legais e confiáveis, mas sempre vale a pena dar uma conferida em outras fontes também, tá? Obrigado por visitar a gente, você é 10/10! 😊 Com carinho, equipe ZéNewsAi 📰 (P.S.: Se encontrar algo estranho, pode nos avisar! Adoramos feedbacks fofinhos! 💌)