Início Tecnologia Alibaba Qwen 3 Modelo de IA de código aberto introduzido com recursos...

Alibaba Qwen 3 Modelo de IA de código aberto introduzido com recursos agênticos

24
0

A equipe QWEN da Alibaba lançou um novo modelo de codificação de inteligência synthetic (AI) na terça -feira. Apelidado de QWEN 3 Coder, o modelo vem com vários recursos de agitação, incluindo codificação agêntica, uso do navegador Agentic e uso de ferramentas Agentic. Os pesquisadores lançaram apenas uma variante do modelo até agora, a instrução QWEN3-CODER-480B-A35B, que é a variante mais poderosa da família. Em termos de desempenho na codificação, a equipe de AI da Alibaba afirma que o modelo de código aberto é comparável ao modelo Claude Sonnet 4 da Anthropic. O novo Modelo de Linguagem Grande (LLM) está disponível para obtain localmente.

QWEN 3 Modelo de codificador com recursos agênticos liberados

Em um Postagem do blogos pesquisadores detalharam a nova ferramenta de codificação Agentic. Disponível em fonte aberta, indivíduos interessados podem baixar os pesos do rosto abraçando de Qwen Listagem e github Listagem. O modelo está disponível com uma licença permissiva do Apache 2.0, que permite o uso acadêmico e comercial. Juntamente com o modelo, uma ferramenta de linha de comando de código aberto apelidado de código QWEN também está disponível para codificação Agentic.

Chegando ao modelo, o QWEN 3 Coder é um modelo de mistura de knowledgeable (MOE) com 480 bilhões de parâmetros. Fora disso, o modelo funciona com 35 bilhões de parâmetros ativos e um comprimento de contexto de 2.56.000 tokens nativamente. A janela de contexto pode ser expandida para um milhão de tokens usando métodos de extrapolação. Os pesquisadores destacaram que o modelo suporta codificação agêntica, uso de navegador e uso de ferramentas agênticas.

A empresa afirma que o QWEN 3 Coder alcançou o desempenho de ponta (SOTA) entre os modelos de código aberto na referência verificada do SWE-BEMCH. Aqui, o SOTA refere -se à pontuação mais alta que anteriormente period inatingível por qualquer outro modelo. A equipe de Qwen disse que essa pontuação foi alcançada criando um sistema escalável usando a infraestrutura da Alibaba Cloud que poderia executar 20.000 ambientes independentes em paralelo.

Para ativar a codificação Agentic, a equipe também lançou a ferramenta de linha de comando QWEN Code. Construído a partir do código Gemini, ele foi equipado com prompts personalizados e protocolos de chamada de função. Essas funcionalidades permitem que o modelo de IA não apenas escreva e edite o código, mas também para implantar e executá -lo em um ambiente de desenvolvimento integrado (IDE).

Enquanto o código QWEN suporta nativamente o modelo QWEN 3 Coder AI, ele também pode ser integrado ao Package de Desenvolvimento de Software program OpenAI (SDK) ao chamar LLMS. Por outro lado, o modelo de codificação QWEN também pode ser usado com o código Claude. Mas os desenvolvedores precisarão solicitar uma chave da API na plataforma de estúdio do Alibaba Cloud Mannequin Studio.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui