Início Tecnologia O modelo de geração de vídeo AI do Baidu’s MUSTEREARERARA ATRAVA DO...

Tecnologia

O modelo de geração de vídeo AI do Baidu’s MUSTEREARERARA ATRAVA DO VEO 3 do Google com suporte de áudio nativo: Relatório

Por

19 Julho 2025

Baidu teria lançado um novo modelo de geração de vídeo de inteligência synthetic (AI) na quarta -feira. De acordo com o relatório, o modelo de IA mesesterer também pode integrar o áudio chinês nos vídeos gerados, tornando -o o segundo modelo após o VEO 3 do Google. A gigante da tecnologia afirma que é o primeiro modelo de IA do mundo com suporte de geração de áudio chinês nativo. Juntamente com a introdução do Modelo de Linguagem Massive (LLM), a empresa também lançou uma nova plataforma de criação de conteúdo de vídeo apelidada de Huixiang. Notavelmente, nem o MoveStereamer nem Huixiang estão atualmente disponíveis fora da China.

O movesterer de Baidu pode gerar áudio chinês

O modelo de geração de vídeo mundial da IA evoluiu significativamente nos últimos dois anos. Mudamos de modelos que lutaram para gerar pessoas com um número fixo de dedos para o LLMS, que agora podem descrever com precisão a física e o movimento realistas. No entanto, uma área que a maioria dos jogadores de IA se absteve de entrar foram vídeos que também suportavam áudio nativamente.

No Google I/O 2025, a gigante da tecnologia se tornou a primeira empresa a oferecer essa capacidade com o VEO 3, que imediatamente se tornou falar da cidade, deixando para trás seu maior rival, o Openai’s Sora. A gigante da tecnologia de Mountain View expandiu recentemente o VEO 3 em todos os 154 países onde o aplicativo Gemini está disponível, destacando o impulso agressivo da empresa por essa ferramenta.

No entanto, de acordo com uma tecnologia na Ásia relatório (via Base de IA), a gigante da tecnologia chinesa Baidu também entrou na corrida com seu modelo de IA mesestream. Diz -se que gera vídeos com áudio chinês e o único modelo com a capacidade de fazê -lo. Notavelmente, o VEO 3 só pode gerar áudio no idioma inglês.

O moverestreador pode não apenas gerar diálogos sincronizados com os vídeos, mas também pode adicionar efeitos sonoros e ruídos ambientais nos vídeos. Diz -se que o Baidu afirmou que o modelo alcançou uma pontuação de 89,38 % no benchmark VBEnch I2V, classificando no topo. A gigante da tecnologia está lançando o LLM como uma ferramenta de criação de conteúdo para os consumidores.

Juntamente com o modelo de IA, o Baidu também lançou uma nova plataforma de conteúdo de vídeo apelidada de Huixiang. Diz-se que Huixiang serve como o front-end para o modelo de IA, onde os usuários podem compartilhar instruções e gerar vídeos. Atualmente, a plataforma suporta gerações de vídeo de 10 segundos na resolução de 1080p, afirmou o relatório. Em comparação, o VEO 3 pode gerar apenas vídeos de oito segundos. Não há clareza sobre a proporção padrão do vídeo e se os usuários puderem gerar vídeos em diferentes proporções.

fonte

O modelo de geração de vídeo AI do Baidu’s MUSTEREARERARA ATRAVA DO VEO 3 do Google com suporte de áudio nativo: Relatório

O movesterer de Baidu pode gerar áudio chinês

DEIXE UMA RESPOSTA Cancelar resposta

Recente

Melhor iPhone em 2025: aqui está qual telefone da Apple você...

Eu testei fones de ouvido do sono por mais de um...

A Rússia lança ataque aéreo ‘inferno’ na cidade ucraniana do leste...

Por que os dubladores de Rick e Morty de Grownup Swim...

Dubai entre as 10 principais cidades mais caras para rico em...

Betfred, World Matchplay estende a colaboração até 2030

O 5 Finger Loss of life Punch foi inspirado por Taylor...

O modelo de geração de vídeo do Google Veo 3 chega...

O governo sírio declara cessar -fogo “abrangente” em Sweida

Seguro Social julho de 2025: O último pagamento do mês é...