⚙️CEVIU IA
Portabilidade é um Mito: Por Que as Melhores Stacks de IA Nunca Serão Independentes de Hardware
A portabilidade de kernel em IA é estruturalmente impossível porque o Pallas da TPU, o CuTile e o CUTLASS da NVIDIA, o NKI da AWS, o FlyDSL da AMD e o tt-Metalium da Tenstorrent expõem conceitos específicos de hardware que nenhuma DSL universal pode unificar. A evidência é que o MoE grouped matmul do MaxText é implementado em 282 linhas de Pallas na TPU, enquanto o equivalente do Flashinfer para Blackwell SM100 requer 4 milhões de linhas de CUDA gerado, sem código compartilhado, pois os próprios algoritmos divergem entre hardwares.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 20 de maio de 2026
- Fonte
- CEVIU IA
