Início Tecnologia A atualização de personalidade do chatgpt que deixou todo mundo louco foi...

A atualização de personalidade do chatgpt que deixou todo mundo louco foi finalmente consertado

10
0

Sam Altman anunciou uma atualização misteriosa do ChatGPT para o modelo GPT-4O padrão na sexta-feira sem revelar muitos detalhes sobre isso. “Atualizamos o GPT-4O hoje!” Altman disse em X. “melhorou a inteligência e a personalidade”, brincou. Em uso actual, o ChatGPT acabou sendo mais bagunçado do que nunca, usuários irritantes no processo.

O fim de semana nem acabou quando Atman reconheceu os problemas com a personalidade de ChatGPT. Ele disse que o Openai implantará correções no domingo e na semana seguinte. Mais importante, o CEO disse que o OpenAI compartilhará seus aprendizados com esse acidente. “Tem sido interessante”, ele brincou.

Outras 48 horas depois, o OpenAI reverteu a personalidade do chatgpt para todos os usuários gratuitos, com Altman ditado Contas pagas também receberiam a versão anterior da personalidade. Mais interessante é o OpenAI mais detalhado Postagem do blog Sobre o assunto que começa a explicar o que deu errado com a mais recente atualização de melhoria da personalidade do ChatGPT que fez a IA se tornar muito agradável e com sicófão.

O Openai explicou as atualizações de personalidade que planejava para a atualização do ChatGPT da semana passada. A empresa queria tornar a personalidade do ChatGPT padrão “mais intuitiva e eficaz em uma variedade de tarefas”.

O resultado foi um chatbot de IA que procurava agradar o usuário, o que foi bastante perturbador. Talvez eu não tenha recebido essas respostas em minhas breves interações com o ChatGPT no fim de semana, mas certamente notei as que outras pessoas compartilharam on -line.

Por que isso aconteceu? O Openai diz que usa instruções em sua especificação de modelo ao moldar o comportamento do modelo. “Também ensinamos nossos modelos a aplicar esses princípios, incorporando sinais de usuário, como o suggestions dos polegares / polegares sobre as respostas do chatgpt”.

É aqui que o Openai estragou, aparentemente. “Nesta atualização, nos concentramos demais no suggestions de curto prazo e não explicamos completamente como as interações dos usuários com o ChatGPT evoluem com o tempo”, diz Openai. “Como resultado, o GPT -4O distorceu as respostas que eram excessivamente favoráveis, mas falsas.”

O Openai explica que a personalidade padrão do ChatGPT deve refletir sua missão. Deve ser “útil, solidário e respeitoso com diferentes valores e experiência”. Mas “efeitos colaterais não intencionais” podem aparecer ao procurar tornar a IA útil e favorável. Além disso, o OpenAI diz que um único padrão de chatgpt não pode atender às necessidades de uma enorme base de usuários. Cerca de 500 milhões de pessoas usam ChatGPT toda semana, de acordo com o weblog.

O Openai não está apenas revertendo a personalidade do chatgpt para o estado anterior. Também está procurando realinhar o modelo para evitar a bajulação no futuro, aplicando o seguinte:

O OpenAI também observou que os usuários do ChatGPT deveriam ter mais controle sobre a personalidade da IA ​​e fazer ajustes. Isso é possível agora com instruções personalizadas, mas o OpenAI quer criar maneiras mais fáceis de os usuários ajustarem a personalidade. O Openai diz que os usuários poderão “fornecer suggestions em tempo actual para influenciar diretamente suas interações e escolher entre várias personalidades padrão”.

Não está claro quando isso acontecerá ou como o suggestions em tempo actual aparecerá. Os usuários do ChatGPT já têm an opportunity de enviar suggestions sobre como a IA lida com respostas. Você verá rotineiramente o ChatGPT oferece dois tipos de respostas, pedindo que você escolha o seu favorito. Isso diz respeito à maneira como o ChatGPT apresenta informações em resposta a avisos. Mas testes futuros de suggestions também podem se concentrar na personalidade.

Estou especulando aqui porque não está claro como o OpenAI planeja permitir que os usuários alterem a personalidade do chatgpt em tempo actual no futuro. Presumivelmente, esse trabalho está apenas começando, e demorará um pouco para ver resultados palpáveis.

Esse trabalho de personalidade da IA ​​pode não parecer um grande negócio para algumas pessoas, com certeza. Mas isso não se trata apenas de bajulação. Trata -se de desenvolver IA segura, e isso envolve acertar sua personalidade.

Enquanto isso, estou feliz que a bajulação esteja se afastando do Chatgpt, no entanto, novamente, eu não experimentei isso sozinho.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui