Pytorch 모델이 느린 이유를 정확히 확인하십시오. 한보기에서 Python to Cuda.현재 도구는 조각을 보여줍니다.Torch Profiler, NSYS & NCU를 자동으로 연결합니다.한 데코레이터는 메모리가 바운드 gemm으로 인해 층 4주의가 느리게 나타납니다. '프로파일 링 박사 학위가 필요하지 않습니다.