Antes do lançamento do Deepseek R2, Alibaba anunciou seu novo modelo QWEN3 AI. O gigante chinês quer melhorar suas capacidades e eficiência de inteligência artificiais em comparação com o modelo Deepseek.
De acordo com Nikkei Asiaa empresa de comércio eletrônico reduziu o poder de computação, enquanto ainda é capaz de treinar 36 trilhões de tokens, o dobro da quantidade usada para o modelo QWEN2.5 anterior. Com isso, o modelo atualizado do Alibaba pode alternar entre um modelo de raciocínio para tarefas complexas e um modo mais rápido para consultas rápidas e diárias.
O mais recente LLM de código aberto é o primeiro conjunto de modelos de raciocínio híbrido da Alibaba. Usando modelos densos para criar tarefas e dois modelos de mistura de especialistas (MOE), o Alibaba é capaz de criar seu modelo para muito menos do que o custo dos gêmeos do Google, o OpenAI’s ChatGPT e o Microsoft’s Copilot.
Como de costume para novos lançamentos, o Alibaba afirma que seu melhor modelo QWEN3 pode superar os modelos lançados entre dezembro e março, incluindo Deepseek-R1, OpenAi-O1, GROK-3 e GEMINI-2.5-Professional em testes de referência para o raciocínio matemático, a proficiência em codificação e as capacidades de ferramentas.
A publicação diz que o Alibaba levou sete meses de trabalho para lançar esse modelo de IA. Interessante, este lançamento ocorre alguns dias depois que o Baidu lançou dois novos modelos de IA que custam “uma fração” de opções de profundidade.
O que torna esses lançamentos tão interessantes é que as empresas chinesas estão tornando seus modelos de IA mais baratos enquanto melhoram exponencialmente suas capacidades de raciocínio. Embora isso possa ajudar a tornar a tecnologia mais acessível, também é necessária para essas empresas, pois os EUA “apertam as restrições às exportações de chips para reduzir os avanços da China no campo”.
Com modelos de IA mais baratos e mais inteligentes, o Openai, Perplexity, Google e muitos outros também precisam melhorar seus LLMs para torná -los mais poderosos sem custar mais aos usuários. Quando a Deepseek lançou seu modelo R1, surpreendeu o mundo e caiu no mercado de ações dos EUA no processo.
Depois disso, as empresas americanas começaram a acelerar o desenvolvimento de seus modelos mais recentes, ainda disponibilizando as mais recentes tecnologias para mais usuários.
Em breve, veremos se o modelo Deepseek R2 mudará tudo mais uma vez, ou se o OpenAI e outras empresas ainda têm alguma vantagem antes de lançar seus próximos modelos de avanço.