Krea 2 detalha uma geração de imagens mais expressiva

24 de junho de 2026

Aprofundamento CEVIU

Aprofundamento

Krea 2 não busca apenas gerar imagens de alta qualidade, mas expandir o espaço criativo acessível em modelos de geração visual. Enquanto muitos sistemas priorizam consistência e realismo fotográfico, o que acaba padronizando estéticas, o Krea 2 foi projetado para explorar uma distribuição visual muito mais ampla, desde estilos deliberadamente difusos até composições experimentais. Isso é possível graças a um pipeline de treinamento em múltiplas etapas e a uma curadoria de dados que rejeita filtros baseados em notas de qualidade estética tradicionais.

O modelo usa arquiteturas inspiradas nos grandes modelos de linguagem (LLMs), como SwiGLU e grouped-query attention, além de melhorias específicas como iREPA e VAEs aprimorados. A integração do Qwen3-VL no processo de legendagem permite capturar detalhes visuais densos com conhecimento de mundo, enquanto uma codificação multilayer para embeddings de texto aumenta a precisão do controle. Tudo isso converge para um DiT (diffusion transformer) otimizado, estável e expressivo por design.

Por que isso importa

A maioria dos modelos de geração de imagem hoje atua como máquinas de produção, não de exploração. O Krea 2 inverte essa lógica: ele não tenta entregar a versão mais polida de um prompt padrão, mas expor um leque amplo de possibilidades visuais. Isso é crucial para artistas, designers e criadores que precisam testar direções antes de definir um estilo. Ao incorporar referências visuais e expansão de prompts com foco em variação controlada, o sistema reduz o hiato entre intenção criativa e saída do modelo. Além disso, ao excluir dados sintéticos do pré-treinamento, evita viéses que limitam a originalidade, uma decisão técnica rara e impactante.

Linha do tempo

2026-06-24
Krea AI lança o Krea 2, com nova arquitetura DiT, pipeline de treinamento em múltiplas etapas e foco em diversidade estilística e controle criativo

Perguntas frequentes

Como o Krea 2 consegue gerar estilos tão variados sem perder controle?

O modelo foi treinado com uma diversidade extrema de dados, sem filtrar por 'qualidade estética' tradicional. Ele aprende desde imagens borradas até estilos nichados, desde que bem descritas. Isso amplia seu espaço interno de representação visual. Combinado a um sistema de expansão de prompts e referência de estilo, o usuário pode navegar esse espaço com precisão, mesmo com entradas simples.

Por que o Krea 2 não usa imagens geradas por IA no treinamento?

A equipe detectou que até pequenas quantidades de dados sintéticos introduzem viéses que tornam o modelo mais previsível e limitam sua capacidade de gerar originalidade. Como as imagens geradas são mais fáceis de aprender, elas dominam a distribuição de saída. Para manter a qualidade máxima e evitar teto de desempenho, todos os dados de treinamento são filtrados com classificadores internos que removem conteúdo sintético.

O que é o 'prompt expander' e como ele ajuda na criação?

É um sistema treinado sobre LLMs de código aberto que transforma prompts curtos ou vagos em descrições visuais ricas, mantendo a intenção do usuário. Em vez de forçar um estilo padrão, ele sugere variações criativas, como mudar iluminação, composição ou humor visual, permitindo que o criador explore antes de refinar. Funciona como um co-piloto criativo dentro do fluxo de geração.

Fontes

krea.aifonte original

Avalie este artigo:

Categoria: CEVIU IA
Publicado: 24 de junho de 2026
Editoria: CEVIU IA