Derinlik
Hopper GPU'larda maksimum FP8 performansının kilidini açın
Öne Çıkan
4 Oylar



Açıklama
Deepseek'ten Deepgemm, Hopper GPU'larında son derece optimize edilmiş FP8 GEMM çekirdekleri için açık kaynaklı bir kütüphane.Kod tabanını temizleyin (~ 300 LOC), JIT-derlenmiş, ağır bağımlılık yok.