Início Tecnologia Google Atualiza a série Gemini 2.5 LLM com novo modelo de nível...

Google Atualiza a série Gemini 2.5 LLM com novo modelo de nível básico, alterações de preços

19
0

A Google LLC introduziu hoje um novo modelo de linguagem grande, Gemini 2.5 Flash-Lite, que pode processar solicita mais rápido e mais econômico do que seu antecessor.

O algoritmo está sendo lançado como parte de uma atualização mais ampla da série Gemini 2.5 LLM da empresa. Os dois modelos existentes na programação, Gemini 2.5 Flash e Gemini 2.5 Professional, passaram da visualização para a disponibilidade geral. O último algoritmo também recebeu várias alterações de preços.

O Gemini 2.5 fez sua estréia authentic em março. Os LLMs da série são baseados em uma arquitetura de mistura de especialistas, o que significa que cada um deles compreende várias redes neurais. Quando um usuário envia um immediate, o Gemini 2.5 ativa apenas uma das redes neurais em vez de todas elas, o que reduz o uso de {hardware}.

A série LLM é a primeira que o Google treinado usando seu chip AI TPUV5P desenvolvido internamente. Segundo a empresa, o processamento de treinamento envolveu vários clusters de servidores que continham 8.960 chips TPUV5p. Os pesquisadores do Google equiparam os clusters com um novo software program que pode mitigar automaticamente alguns problemas técnicos.

Os modelos Gemini 2.5 são multimodais, com suporte para até 1 milhão de tokens por immediate. O Google descreve o algoritmo principal da série, Gemini 2.5 Professional, como seu LLM mais capaz até o momento. Durante os testes internos, superou o O3-mini do OpenAI em uma variedade de referências de matemática e codificação.

Gemini 2.5 Flash, o modelo que passou para a disponibilidade geral hoje, juntamente com a Gemini 2.5 Professional, negocia algum desempenho por eficiência. Ele responde para solicitar mais rápido e incorre em custos de inferência mais baixos. O Gemini 2.5 Flash-Lite, o novo modelo que o Google estreou hoje, é um modelo ainda mais eficiente que está posicionado como o novo modelo de nível básico na série LLM.

“2.5 Flash Lite possui uma qualidade geral maior que 2,0 flash-lite sobre codificação, matemática, ciências, raciocínio e benchmarks multimodais”, Tulsee Doshi, diretor sênior de gerenciamento de produtos da Gemini, detalhado em um Postagem do blog. “Ele se destaca em tarefas sensíveis à latência de alto quantity, como tradução e classificação, com menor latência que 2,0 flash-lite e 2,0 flash em uma amostra ampla de avisos”.

O flash-Lite Gemini 2.5 é cobrado a uma taxa de 10 centavos por 1 milhão de tokens de entrada quando os desenvolvedores enviam instruções que contêm texto, imagens ou vídeo. Isso é menor que um-10º o custo do Gemini 2.5 Professional. O preço por milhão de tokens de produção, por sua vez, é de 40 centavos em comparação com US $ 10 para Gemini 2,5 Professional.

O Google está mudando o preço de seu modelo flash Gemini 2.5 de gama média como parte da atualização. A empresa agora cobrará 30 centavos por milhão de tokens de entrada e US $ 2,50 para 1 milhão de tokens de produção em comparação com 15 centavos e US $ 3,50, respectivamente, antes. Além disso, não há mais preços separados para tokens que o modelo processa em “Modo de pensamento”. O modo permite que o LLM aumente a qualidade da saída, aumentando a quantidade de tempo e calcule os recursos que ele usa para gerar respostas imediatas.

Imagem: Google

Seu voto de apoio é importante para nós e nos ajuda a manter o conteúdo livre.

Um clique abaixo suporta nossa missão de fornecer conteúdo gratuito, profundo e relevante.

Junte -se à nossa comunidade no YouTube

Junte -se à comunidade que inclui mais de 15.000 especialistas em #Cubealumni, incluindo o CEO da Amazon.com, Andy Jassy, ​​o fundador e CEO da Dell Applied sciences, Michael Dell, o CEO da Intel Pat Gelsinger e muito mais luminárias e especialistas.

“O TheCube é um parceiro importante da indústria. Vocês realmente fazem parte de nossos eventos e realmente apreciamos que você venha e eu sei que as pessoas apreciam o conteúdo que você cria também” – Andy Jassy

OBRIGADO

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui