Início Tecnologia Como ensinamos uma rede neural a projetar lápides

Como ensinamos uma rede neural a projetar lápides

3
0

 

Quando as pessoas pensam em aprendizado de máquina, as lápides provavelmente não vêm à mente. Mas em uma das aplicações mais profundas da IA ​​generativa, construímos um sistema que usa aprendizado de máquina para projetar produtos memoriais personalizados – sim, incluindo lápides – lacrendo preferências pessoais e sensibilidades culturais.

Este não foi apenas um experimento peculiar de ML. Era uma aplicação de modelos generativos, processamento de linguagem natural e sistemas humanos no loop, tudo para atender a uma necessidade altamente sensível e profundamente humana: comemorando uma vida.

O problema: projetar com dignidade

O design memorial é uma arte e uma tradição. As famílias querem algo pessoal, respeitoso e muitas vezes simbólico. O desafio é que o processo de design é lento, emocionalmente tributado e restrito por materiais, regulamentos do cemitério e tradições religiosas ou culturais.

Pretendemos criar algo que possa ajudar – não substituir – Designers: um gerador de lápide que poderia produzir opções de design realistas e significativas com base em dados anteriores e preferências do cliente.

Você pode experimentar aqui: headstonesdesigner.com/generator (todos os dados de treinamento vêm do site ao vivo –

Etapa 1: Compreendendo o domínio

Antes de tocarmos em Tensorflow ou escreveu uma única linha de código, nos mergulhamos no mundo da arte memorial. Nós estudamos:

  • Estilos tradicionais e contemporâneos
  • Normas religiosas e culturais
  • Restrições materiais (granito, mármore, etc.)
  • Regulamentos do cemitério, como a largura do monumento Max por parcela

Isso não era opcional. Projetar IA para um domínio sensível como esse requer um profundo respeito e nuances. Errar errado não foi apenas um bug ux – foi ofensivo.

Etapa 2: Construindo o conjunto de dados

Reunimos um conjunto de dados surpreendentemente diversificado:

  • Milhares de imagens de design anotado
  • Arquivos CAD de lápides existentes
  • Histórico de preferências do cliente
  • Texto de inscrições
  • Padrões dimensionais do cemitério

Tudo isso precisava ser limpo, normalizado e vetorizado. Os textos foram incorporados usando modelos como Bert. As imagens foram pré -processadas e aumentadas. Não se tratava apenas de lançar dados em um modelo – era sobre como fazê -lo Aprendável.

Etapa 3: Arquitetura e treinamento de modelos

Testamos alguns tipos de modelos em paralelo:

  • Stylegan2: Para gerar imagens estilizadas de alta qualidade de desenhos memoriais
  • VAES (AutoEncoders Variação): Para interpolar entre estilos de design e permitir variações controladas pelo usuário
  • Transformers (GPT): Para gerar inscrições que pareciam pessoais, relevantes e respeitosos

Uma parte particularmente complicada era garantir que o texto e o visual correspondessem. Uma lápide de estilo gótico não deve ter inscrições em quadrinhos.

Nós abordamos isso com:

  • Treinamento multimodal: Combinar modelos de visão e linguagem (como clipe) para avaliar o alinhamento
  • Gans condicionais: Usando o texto como entrada para orientar a geração visual

Etapa 4: Gerenciando as incógnitas

Tivemos muitos momentos de “Ai se foram estranhos”.

  • Algumas saídas iniciais pareciam mais esculturas modernistas do que memoriais.
  • A transferência de estilo às vezes cruzava as linhas culturais de maneiras desajeitadas.
  • Ocasionalmente, o GPT gerou epitáfios surdos.

Para mitigar isso, construímos feedback humano no loop. Designers e consultores culturais revisaram os resultados e sinalizaram problemas. Esse feedback voltou ao ajuste do modelo.

Também usamos técnicas como discriminadores de estilo em Gans para aplicar restrições e filtros de pós-geração para validar o conteúdo de texto.

Etapa 5: Avaliação e Resultados

Não apenas ocular os resultados. A avaliação foi multifacetada:

  • Pontuações FID para realismo de imagem
  • Pontuações bleu e avaliação humana para precisão do texto
  • Estudos de usuários e Revisões de especialistas para fidelidade estética e cultural

O resultado final? Um sistema que poderia gerar projetos de lápides emocionalmente ressonantes, visualmente precisos e com reconhecimento de contexto.

Você pode interagir com o gerador aqui: headstonesdesigner.com/generator

Lições aprendidas

Algumas sugestões:

  • O contexto cultural não é um caso de borda – é o principal requisito em domínios de design sensíveis.
  • A IA generativa é poderosa, mas sem restrições, ela se aproxima facilmente em um território estranho ou inadequado.
  • O feedback humano não é apenas útil; é obrigatório.

O futuro

Estamos explorando como essa tecnologia pode se estender a outros domínios: design de convite de casamento, prêmios personalizados, arte comemorativa e muito mais. Em qualquer lugar, o design é pessoal e alto, há uma oportunidade de misturar o ML generativo com os cuidados humanos.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui