flashmla

    Hopper GPUのより速いLLM推論

    特集
    5 投票
    flashmla media 1
    flashmla media 2
    flashmla media 3

    説明

    DeepseekのFlashmlaは、Hopper GPUの効率的なMLAデコードカーネルであり、可変長シーケンス用に最適化されています。最大3000 GB/sのメモリ帯域幅と580 TFLOPSを達成します。

    推奨製品