Flashmla
أسرع استنتاج LLM على وحدات معالجة الرسومات هوبر
ظهرت
5 أصوات



وصف
Flashmla ، من Deepseek ، هو نواة فك تشفير MLA فعالة لعمليات وحدات معالجة الرسومات القادوس ، محسّنة لتسلسل طول متغير.يحقق عرض النطاق الترددي لذاكرة ما يصل إلى 3000 جيجابايت/ثانية و 580 tflops.