Flashmla
Kesimpulan LLM lebih cepat pada GPU Hopper
Pilihan
5 Undi



Penerangan
Flashmla, dari DeepSeek, adalah kernel penyahkodan MLA yang cekap untuk GPU hopper, yang dioptimumkan untuk urutan panjang berubah-ubah.Mencapai sehingga lebar jalur memori 3000 GB/s dan 580 TFLOPS.