Baidu teria lançado um novo modelo de geração de vídeo de inteligência synthetic (AI) na quarta -feira. De acordo com o relatório, o modelo de IA mesesterer também pode integrar o áudio chinês nos vídeos gerados, tornando -o o segundo modelo após o VEO 3 do Google. A gigante da tecnologia afirma que é o primeiro modelo de IA do mundo com suporte de geração de áudio chinês nativo. Juntamente com a introdução do Modelo de Linguagem Massive (LLM), a empresa também lançou uma nova plataforma de criação de conteúdo de vídeo apelidada de Huixiang. Notavelmente, nem o MoveStereamer nem Huixiang estão atualmente disponíveis fora da China.
O movesterer de Baidu pode gerar áudio chinês
O modelo de geração de vídeo mundial da IA evoluiu significativamente nos últimos dois anos. Mudamos de modelos que lutaram para gerar pessoas com um número fixo de dedos para o LLMS, que agora podem descrever com precisão a física e o movimento realistas. No entanto, uma área que a maioria dos jogadores de IA se absteve de entrar foram vídeos que também suportavam áudio nativamente.
No Google I/O 2025, a gigante da tecnologia se tornou a primeira empresa a oferecer essa capacidade com o VEO 3, que imediatamente se tornou falar da cidade, deixando para trás seu maior rival, o Openai’s Sora. A gigante da tecnologia de Mountain View expandiu recentemente o VEO 3 em todos os 154 países onde o aplicativo Gemini está disponível, destacando o impulso agressivo da empresa por essa ferramenta.
No entanto, de acordo com uma tecnologia na Ásia relatório (via Base de IA), a gigante da tecnologia chinesa Baidu também entrou na corrida com seu modelo de IA mesestream. Diz -se que gera vídeos com áudio chinês e o único modelo com a capacidade de fazê -lo. Notavelmente, o VEO 3 só pode gerar áudio no idioma inglês.
O moverestreador pode não apenas gerar diálogos sincronizados com os vídeos, mas também pode adicionar efeitos sonoros e ruídos ambientais nos vídeos. Diz -se que o Baidu afirmou que o modelo alcançou uma pontuação de 89,38 % no benchmark VBEnch I2V, classificando no topo. A gigante da tecnologia está lançando o LLM como uma ferramenta de criação de conteúdo para os consumidores.
Juntamente com o modelo de IA, o Baidu também lançou uma nova plataforma de conteúdo de vídeo apelidada de Huixiang. Diz-se que Huixiang serve como o front-end para o modelo de IA, onde os usuários podem compartilhar instruções e gerar vídeos. Atualmente, a plataforma suporta gerações de vídeo de 10 segundos na resolução de 1080p, afirmou o relatório. Em comparação, o VEO 3 pode gerar apenas vídeos de oito segundos. Não há clareza sobre a proporção padrão do vídeo e se os usuários puderem gerar vídeos em diferentes proporções.