O OpenAI está lançando um novo agente de IA de uso geral no ChatGPT, que a empresa, segundo a empresa, pode concluir uma ampla variedade de tarefas baseadas em computador em nome dos usuários. O OpenAI diz que o agente pode navegar automaticamente no calendário de um usuário, gerar apresentações e apresentações de slides editáveis e executar o código.
A ferramenta, chamada ChatGPT Agent, combina vários recursos das ferramentas agentes anteriores do OpenAI, incluindo a capacidade do operador de clicar em websites, bem como a capacidade da profunda pesquisa de sintetizar informações de dezenas de websites em um relatório conciso de pesquisa. O Openai diz que os usuários poderão interagir com o agente simplesmente solicitando o ChatGPT em linguagem pure.
Na quinta -feira, o OpenAI está lançando o ChatGPT Agent para assinantes de seus planos de Professional, mais e equipe. Para ativar a ferramenta, os usuários podem selecionar o “modo agente” no menu suspenso de ferramentas do ChatGPT.
O lançamento do ChatGPT Agent representa a tentativa mais ousada do OpenAI ainda de transformar o ChatGPT em um produto Agentic que pode tomar ações e descarregar tarefas para os usuários, em vez de apenas responder a perguntas. Nos últimos anos, as empresas do Vale do Silício, incluindo Openai, Google e Perplexity, revelaram dezenas de agentes de IA que prometeram fazer exatamente isso. No entanto, essas versões iniciais dos agentes de IA provaram lutar com tarefas complexas e parecem menos atraentes como produtos do que os executivos finais da Tech Imaginative and prescient lançam os agentes da IA.
Dito isto, o Openai diz que o agente do ChatGPT é muito mais capaz do que suas ofertas anteriores.
O novo agente do OpenAI pode acessar os conectores ChatGPT, permitindo que os usuários conectem aplicativos como Gmail e Github para que o agente possa encontrar informações relevantes para seus avisos. Além disso, o OpenAI diz que o ChatGPT Agent tem acesso a um terminal e pode usar APIs para acessar determinados aplicativos.
O modelo subjacente ao ChatGPT Agent oferece desempenho de última geração em vários benchmarks, de acordo com o Openai.
Evento do TechCrunch
São Francisco
|
27-29 de outubro de 2025
A empresa diz que o modelo do agente do ChatGPT obtém 41,6% no último exame da humanidade (PASS@1), um teste difícil composto por milhares de perguntas em mais de cem assuntos. Isso é aproximadamente o dobro do que o OpenAI e O4-Mini marcaram no teste.
Na FrontierMath, um dos benchmarks de matemática mais difíceis, o OpenAI diz que o ChatGPT Agent obtém 27,4% quando tiver acesso a ferramentas, como um terminal para execução de código. A pontuação anterior de última geração vem da O4-Mini, que obteve apenas 6,3%.
O Openai observa que desenvolveu o agente do ChatGPT com segurança em mente, principalmente porque o produto apresenta alguns recursos novos que podem torná -lo mais perigoso nas mãos de um ator ruim. Como o agente de chatgpt de quão capaz é realmente para ser visto.