Há pouco tempo, escrevi que os agentes da IA eram o futuro da IA: ferramentas que poderiam realizar tarefas para você, como encomendar mantimentos ou reservar reuniões. O último lançamento do Openai faz com que a realidade pareça um pouco mais próxima.
Na quinta -feira, durante uma transmissão ao vivo, o Openai lançou um agente do ChatGPT, que a empresa afirma que pode lidar com tarefas complexas para você do início ao fim. Alguns exemplos do OpenAI fornecidos estavam olhando para o seu calendário e escrevendo um briefing com base em seus próximos eventos, ou mesmo planejando e comprando ingredientes para uma refeição que você estava procurando cozinhar.
Como funciona
Os recursos de maior ponta do OpenAI, incluindo operador e pesquisa profunda, deram ao público um gostinho dos recursos de agênticos da empresa e agora alimentam esse novo modo de agente. O operador, lançado em janeiro, foi criado para interagir diretamente com um navegador da Net para realizar ações para você, enquanto a pesquisa profunda é um recurso agêntico que pode pesquisar na Net por você e compor um relatório detalhado em minutos que levariam horas de humanos.
Depois de perceber que muitas das consultas sendo alimentadas com o operador foram mais adequadas para pesquisas profundas, o Openai decidiu combinar os dois nessa nova experiência – e adicionar algumas novas ferramentas.
Para iniciantes, o agente ChatGPT usa um navegador visible que interage com a Net por meio de uma interface gráfica do usuário (GUI), um navegador baseado em texto, um terminal e acesso direto da API, de acordo com o comunicado. Ele também usa os conectores ChatGPT, um recurso que permite que os usuários conectem aplicativos como Gmail e Github ao ChatGPT para que ele possa obter informações relevantes para atender à sua solicitação.
Com todas essas diferentes fontes de informação, o ChatGPT é capaz de raciocinar o que é o melhor para a tarefa em questão e obter informações de acordo. Esse processamento é feito usando seu próprio computador digital e distingue entre raciocínio e ação com base na instrução humana, o que permite manter o contexto enquanto retira várias ferramentas.
O ChatGPT Agent é flexível e orientável. Ele permite interromper uma solicitação no meio do processo e colaborar com ele para fornecer instruções mais claras que melhor se adequam ao resultado desejado. Mesmo que use as novas informações, elas não perderão o antigo, permitindo que os usuários aproveitem o contexto adicional. Ele também solicitará mais detalhes e classificações necessárias para realizar a tarefa em questão.
O que você pode fazer com o agente do ChatGPT?
As possibilidades são infinitas. Você pode automatizar as tarefas tão simples quanto agendar uma consulta para si mesmo no seu salão favorito ou tão complexo quanto atualizar uma planilha com novos dados financeiros, mantendo a formatação desejada.
Se tudo correr conforme o plano, possibilidades futuras, como fazer uma viagem de IA para você ou reorganizar seu cronograma de reuniões, agora pode ser possível através do agente ChatGPT da OpenAI. Por fim, apenas o tempo e os testes dirão se isso será executável tão suavemente quanto está sendo anunciado, mas, em teoria, deve ser tão simples quanto você perguntando o que deseja ser feito de maneira conversada e ai lidando com o resto.
Segurança
Obviamente, uma IA que pode acessar suas informações pessoais e agir para você naturalmente traz preocupações de segurança e privacidade. O OpenAI aborda esse de frente, oferecendo uma página inteira no put up em vlog dedicado a essas preocupações, além do cartão de modelo common. Openai diz que adicionou salvaguardas para desafios descobertos na pré-visualização da pesquisa do operador, como lidar com informações sensíveis na net ao vivo e acesso limitado na rede de terminais.
A empresa diz que também levou em consideração os riscos específicos aos quais os agentes são expostos, como a manipulação adversária por meio de injeção imediata, adicionando salvaguardas adicionais. Por exemplo, algumas limitações no momento incluem a criação de apresentações de slides. Para uma compreensão completa das limitações e riscos de segurança, vale a pena dar uma olhada na postagem do weblog e no cartão de modelo.
Quem pode acessar o agente do ChatGPT e como?
Ao contrário dos recursos de maior ponta do OpenAI, que geralmente são limitados aos usuários mais bem pagos após o lançamento, o OpenAI está disponibilizando o agente ChatGPT para os usuários do Professional, mais e da equipe. Os usuários profissionais terão acesso até o closing do dia, enquanto os usuários de mais e equipe terão nos próximos dias e usuários de empresas e educação nas próximas semanas.
Os usuários profissionais têm mais largura de banda, com 400 mensagens por mês, enquanto outros usuários pagos recebem 40 mensagens mensalmente com a opção de se estender por opções flexíveis baseadas em crédito.
Para ativar o recurso, os usuários simplesmente selecionam o “modo agente” do suspensão da ferramenta durante uma conversa com o chatbot.