⚙️CEVIU IA
VLLM V0 para V1: Correção Antes de Ajustes em RL
A atualização vLLM V1 aprimorou a precisão da inference ao abordar discrepâncias no cálculo de logprob, padrões de runtime, atualizações de peso em andamento e precisão da projeção final. As principais correções incluíram o ajuste dos logprobs processados, a desativação do cache de prefixo, a correspondência dos modelos de atualização de peso e a garantia do cálculo fp32 do lm_head para alinhar com o comportamento do vLLM V0. Essas mudanças resolveram desalinhamentos iniciais de treinamento, assegurando que o novo motor mantenha o desempenho esperado de RL sem correções desnecessárias no lado do objetivo.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 07 de maio de 2026
- Fonte
- CEVIU IA
