Portabilidade é um Mito: Por Que as Melhores Stacks de IA Nunca Serão Independentes de Hardware

20 de maio de 2026

A portabilidade de kernel em IA é estruturalmente impossível porque o Pallas da TPU, o CuTile e o CUTLASS da NVIDIA, o NKI da AWS, o FlyDSL da AMD e o tt-Metalium da Tenstorrent expõem conceitos específicos de hardware que nenhuma DSL universal pode unificar. A evidência é que o MoE grouped matmul do MaxText é implementado em 282 linhas de Pallas na TPU, enquanto o equivalente do Flashinfer para Blackwell SM100 requer 4 milhões de linhas de CUDA gerado, sem código compartilhado, pois os próprios algoritmos divergem entre hardwares.

Avalie este artigo:

Categoria: CEVIU IA
Publicado: 20 de maio de 2026
Fonte: CEVIU IA

Quer receber mais sobre CEVIU IA?