Flashmla
Hopper GPU'larda daha hızlı LLM çıkarım
Öne Çıkan
5 Oylar



Açıklama
Deepseek'ten Flashmla, değişken uzunluk dizileri için optimize edilmiş, hopper GPU'lar için etkili bir MLA kod çözme çekirdeğidir.3000 GB/s bellek bant genişliği ve 580 TFLOP'lara kadar.