O Baidu lançou os modelos Ernie 4.5 Série de Inteligência Synthetic (AI) em código aberto na segunda-feira. A gigante da tecnologia chinesa havia dito anteriormente que disponibilizaria seus grandes modelos de idiomas proprietários (LLMS) para a comunidade aberta em 31 de julho. Agora lançou 10 variantes diferentes da série, com cada um dos modelos construídos na arquitetura da mistura de especialistas (MOE). Juntamente com os modelos, a empresa também lançou kits de ferramentas de desenvolvimento multi-hardware para Ernie 4.5 em código aberto.
Baidu lança 10 variantes de modelos Ernie 4.5 AI em código aberto
Em um publicar Em X (anteriormente conhecido como Twitter), a gigante da tecnologia chinesa anunciou o lançamento dos 10 modelos de IA Ernie 4.5 de código aberto. Quatro deles são modelos multimodais de linguagem da visão, oito são modelos MOE e dois são modelos de pensamento ou raciocínio. Além disso, a lista também inclui cinco modelos pós-treinados, enquanto outros são pré-treinados. Esses modelos agora podem ser baixados do rosto abraçando da empresa Listagem ou do seu github Listagem.
Em um Postagem do blogBaidu disse que os modelos MOE apresentam um whole de 47 bilhões de parâmetros, com três bilhões deles sendo ativos por vez. Os maiores modelos entre as 10 variantes apresentam 424 bilhões de parâmetros. Todos eles são treinados usando a estrutura de aprendizado profundo Paddlepddle.
Com base nos testes internos, a empresa reivindicou o modelo Ernie-4.5-300B-A47B-BASE supera o Deepseek-V3-671B-A37B-BASE em 22 dos 28 benchmarks. Da mesma forma, afirmou que o Ernie-4.5-21b-A3b-BASE supera o QWEN3-30B-A3B-BASE em múltiplas matemáticos e referências de raciocínio, apesar de ter 30 % menos parâmetros.
O Baidu também revelou seus métodos de treinamento nas páginas modelo. A Companhia usou uma estrutura MOE heterogênea no processo de pré-treinamento e dimensionou os modelos usando técnicas como paralelismo especialista do Intra Node, programação de pipeline com eficiência de memória, treinamento de precisão mista FP8 e um método de recomputação de grão fino.
Além dos modelos, o Baidu também disponibilizou Erniekit para a comunidade aberta. É um package de ferramentas de desenvolvimento para os modelos Ernie 4.5 Collection. Com isso, os desenvolvedores podem realizar o ajuste fino (SFT) de pré-treinamento, SFT, adaptação de baixo rank (LORA) e outras técnicas de personalização. Notavelmente, todos os modelos estão disponíveis sob a licença permissiva do Apache 2.0, que permite o uso acadêmico e comercial.