API兼容性的OpenAi替换量🚀fly in fors llms在CPU或GPU上使用cpus或GPU⚖️自动升级,从0🛠️零依赖项(no istio,knative等)自动升级(no Istio,knative等)🤖运行OSS模型服务器(VLLM和Ollama)🔋CHAT UI包括CHAT UI🔋CHAT UI