Deepgemm
Déverrouiller les performances FP8 maximales sur les GPU de trémie
En vedette
4 Votes



Description
Deepgemm, de Deepseek, est une bibliothèque open source pour les noyaux GEMM FP8 hautement optimisés sur des GPU de topper.Base de code propre (~ 300 LOC), compilée par Jit, pas de fortes dépendances.