Flashmla
Hopper GPU'larda daha hızlı LLM çıkarım
Öne çıkan
5 Oy



Tanım
Deepseek'ten Flashmla, değişken uzunluk dizileri için optimize edilmiş, hopper GPU'lar için etkili bir MLA kod çözme çekirdeğidir.3000 GB/s bellek bant genişliği ve 580 TFLOP'lara kadar.