DeepSeek의 DeepGemm은 Hopper GPU의 고도로 최적화 된 FP8 GEMM 커널을위한 오픈 소스 라이브러리입니다.Clean Codebase (~ 300 LOC), JIT 컴파일, 무거운 의존성이 없습니다.