Início Tecnologia Mark Zuckerberg diz que os mais recentes modelos de llama de Meta...

Mark Zuckerberg diz que os mais recentes modelos de llama de Meta colocam a IA de código aberto no banco do motorista

39
0

A Meta Platforms Inc. revelou o mais recentes adições para o seu Lhama Família de grandes modelos de inteligência synthetic da linguagem no sábado, alegando que eles são entre os mais poderosos já lançados ao público.

Os novos modelos, que fazem parte da série LLAMA 4, estão disponíveis para acessar agora através do meta -assistente da Internet e do Messenger, Whatsapp e Instagram, e também podem ser baixados do próprio Meta ou Abraçando o rosto.

Eles incluem Llama 4 Scout, que é considerado um modelo pequeno que se encaixa dentro de uma única unidade de processamento gráfica NVIDIA H100, e o LLAMA 4 Maverick, que é um modelo maior de OpenAI mais comparável do GPT-4O e o flash Gemini 2.0 da Google LLC. Diz -se que ambos os modelos têm 17 bilhões de parâmetros ativos.

A empresa ainda está trabalhando no maior modelo da formação LLAMA 4. De acordo com o executivo -chefe da Meta, Mark Zuckerberg, é chamado LLama 4 Behemoth, e será o “modelo básico de desempenho mais alto do mundo”, uma vez lançado.

A Meta diz que os modelos LLAMA 4 são os mais avançados que se desenvolveu até agora e também “Melhor da classe” em termos de modalidade. Os modelos multimodais de IA são capazes de processar diferentes tipos de formatos de dados, incluindo texto, imagens, áudio e vídeo, para que possam compreender cenários mais complexos e gerar melhores respostas.

O meta -chefe de produto Chris Cox disse à CNBC em março que os modelos LLAMA 4 são projetado Para alimentar os chamados agentes de IA, que são modelos e sistemas de IA mais sofisticados com habilidades aprimoradas de raciocínio e a capacidade de navegar na Internet e tomar ações. Eles podem ser instruídos a concluir várias tarefas em nome dos seres humanos, e eles os farão com uma supervisão mínima.

Meta disse que o Llama 4 Scout é um modelo pequeno, mas extremamente eficiente, projetado para executar apenas uma placa gráfica de ponta. É capaz de processar até 10 milhões de “tokens”, que é o termo do setor de IA para pedaços de palavras ou dados. Isso representa um salto maciço dos LLMs anteriores “pequenos”, observou a empresa.

O LLAMA 4 Scout superou outros pequenos LLMs, como o Gemma 3 do Google e o Gemini 2.0 e o Mistral Mistral 3.1 em vários benchmarks -chave que abrangem uma “ampla gama” de aplicações.

Quanto ao lhama 4 Maverick, essa é uma iteração mais poderosa, projetada para lidar com tarefas como escrever código, escrita criativa, abordar problemas de matemática e entender imagens e vídeos. De acordo com a Meta, supera modelos rivais como o GPT-4O do OpenAI e o Gemini 2.0 do Google, mesmo que seja mais eficiente e econômico. Ele não o comparou com o modelo Gemini 2.5 lançado recentemente, mas disse que o desempenho de Maverick também está em pé de igualdade com o modelo de raciocínio V3 da Deepseek Ltd., apesar de usar menos da metade de seus parâmetros ativos.

Em uma postagem detalhada do weblog, descrevendo os novos modelos e como eles foram criados, a Meta explicou que usava um tipo mais novo de sistema chamado “Mistura de Expertos” ou MOE, o que lhes permite trabalhar com mais eficiência. Em vez de usar o modelo inteiro para cada tarefa, os sistemas MOE ativam apenas a peça necessária para concluir a tarefa em mãos, para que possam funcionar mais rapidamente e usar menos energia.

A Meta também falou um pouco sobre o próximo modelo LLAMA 4 Behemoth, que terá 288 bilhões de parâmetros ativos e quase 2 trilhões de parâmetros no complete quando for lançado. Ainda está sendo treinado, portanto, ainda não foi lançado, mas já está sendo usado para “ensinar” os modelos menores de llama 4 usando uma técnica chamada “destilação”, que permite que o conhecimento seja transferido de modelos maiores para menores. De acordo com a Meta, os testes iniciais mostram que o LLAMA 4 Behemoth superou significativamente os modelos concorrentes, como GPT-4.5 e Claude Sonnet 3.7 em vários benchmarks de caule.

Além do desempenho, a Meta também se concentrou em tornar os modelos LLAMA 4 mais seguros e equilibrados. Ele aumentou as proteções internas que visam impedir que elas forneçam respostas prejudiciais ou tendenciosas, para que possam fornecer respostas mais equilibradas a perguntas controversas e politicamente sensíveis. Como tal, os modelos Llama 4 terão menos probabilidade de se recusar a responder a perguntas difíceis ou se inclinar muito em um lado do espectro político, disse Meta.

“Nosso objetivo é construir a principal IA do mundo, de código aberto e torná -lo universalmente acessível, para que todos no mundo se beneficiem”, disse Zuckerberg em um vídeo no Instagram. “Eu disse por um tempo que acho que a IA de código aberto se tornará os principais modelos e, com o LLAMA 4, isso está começando a acontecer. Meta Ai está recebendo uma grande atualização hoje”.

Podemos esperar ver muito mais da Meta na frente da IA ​​quando inicia sua primeira conferência anual da Llamacon AI em 29 de abril, quando pode muito bem lançar o modelo Llama 4 Behemoth. Também é esperado anunciar um aplicativo de meta AI independente no evento.

Imagem: Siliconangle/Freepik AI Suite

Seu voto de apoio é importante para nós e nos ajuda a manter o conteúdo livre.

Um clique abaixo suporta nossa missão de fornecer conteúdo gratuito, profundo e relevante.

Junte -se à nossa comunidade no YouTube

Junte -se à comunidade que inclui mais de 15.000 especialistas em #Cubealumni, incluindo o CEO da Amazon.com, Andy Jassy, ​​o fundador e CEO da Dell Applied sciences, Michael Dell, o CEO da Intel Pat Gelsinger e muito mais luminárias e especialistas.

“O TheCube é um parceiro importante da indústria. Vocês realmente fazem parte de nossos eventos e realmente apreciamos que você venha e eu sei que as pessoas apreciam o conteúdo que você cria também” – Andy Jassy

OBRIGADO

fonte