Início Tecnologia A AMD revela a difusão estável 3 modelo médio com suporte para...

A AMD revela a difusão estável 3 modelo médio com suporte para geração de imagens de 4 megapixels em laptops Ryzen AI

15
0

A AMD lançou um novo modelo de inteligência synthetic média estável 3 (AI) otimizada para unidades de processamento neural do XDNA 2 (NPUs). O fabricante de chips afirmou que é o primeiro modelo de IA do mundo que processa saídas no formato BF16. O modelo será suportado pelos laptops Ryzen AI mais recentes com pelo menos 24 GB de RAM, depois que os usuários baixam o software program beta Amuse 3.1 da Tensorstack. O meio de difusão estável 3 é um modelo de geração de imagens no dispositivo que não requer conectividade da Web.

O modelo de geração de imagem da AMD pode gerar imagens prontas para impressão

Em um comunicado de imprensa, a gigante da tecnologia baseada em Santa Clara detalhou o novo modelo de geração de imagens. O modelo de IA é baseado no meio de difusão estável 3, otimizado para as NPUs XDNA da empresa e está equipado nos laptops Ryzen AI liberados em 2024 e mais recentes.

A empresa afirma que o modelo pode ser usado para gerar imagens de qualidade de ações a partir de avisos de texto. O modelo gera imagens de resolução de 1024 × 1024, que são então upcaladas para resolução pronta para impressão 2048 × 2048 usando os recursos da NPU.

O novo modelo de IA faz parte do novo aplicativo AMDSorSorstack AMUSE 3.1 Desktop, que é gratuito para baixar e instalar. Como o modelo de geração de imagens é executado totalmente localmente, ele até funciona quando o dispositivo não está conectado à Web. O processamento de dados ocorre no dispositivo, alimentado pelo XDNA 2 NPUS.

A AMD disse que funcionou nos requisitos de memória do modelo de IA e agora requer RAM de 24 GB, em vez de 32 GB de RAM, o que period necessário para o modelo estável XL Turbo. Além disso, o novo modelo de imagem consome apenas 9 GB de RAM enquanto ativo. A empresa conseguiu isso usando o ponto de flutuação de bloco 16 ou o formato Block FP16 (BF16) eficiente em termos de memória.

A gigante da tecnologia destacou que o modelo estável de difusão 3 AI média adere estritamente ao immediate, estrutura e ordem. A AMD disse que os usuários que experimentam o modelo devem primeiro descrever o tipo de imagem, depois os componentes estruturais e, finalmente, detalhes e outro contexto. Os avisos negativos podem ser usados para remover elementos da imagem e a colocação de paradas finais pode alterar o entendimento do contexto do modelo.

fonte