Flashmla
أسرع استنتاج LLM على وحدات معالجة الرسومات هوبر
مميز
5 الأصوات



الوصف
Flashmla ، من Deepseek ، هو نواة فك تشفير MLA فعالة لعمليات وحدات معالجة الرسومات القادوس ، محسّنة لتسلسل طول متغير.يحقق عرض النطاق الترددي لذاكرة ما يصل إلى 3000 جيجابايت/ثانية و 580 tflops.