Periflow是用于包括LLM在内的生成AI模型的创新服务引擎。 Periflow以低成本实现速度,可节省70〜90%的GPU。 Periflow有两个部署选项:Periflow容器和Periflow Cloud。