Profunda
Desbloquee el rendimiento máximo de FP8 en GPU de Hopper
Destacado
4 Votos



Descripción
DeepGemm, de Deepseek, es una biblioteca de código abierto para núcleos GEMM FP8 altamente optimizados en GPU de Hopper.Limpie la base de código (~ 300 LOC), compilada con JIT, sin dependencias pesadas.