Periflow는 LLM을 포함한 생성 AI 모델을위한 혁신적인 서빙 엔진입니다. Periflow는 저렴한 비용으로 속도를 달성하여 70 ~ 90% GPU를 절약합니다. Periflow에는 Periflow 컨테이너와 Periflow Cloud의 두 가지 배포 옵션이 있습니다.