
Os engenheiros do DeepSeek decidiram usar o PTX para aproveitar ao máximo as GPUs H800 Uma das estratégias foi alocar apenas 20 SMs de cada placa para comunicação entre servidores.
source
https://br.ign.com/tech/136010/news/agora-sabemos-segredo-da-extrema-eficiencia-do-deepseek-contornou-o-padrao-cuda-da-nvidia