向量缓存

有效LLM查询缓存的Python库

精选

23 投票

描述

随着AI应用程序的吸引力，使用大语言模型（LLM）的成本和延迟可能会升级。VectorCache通过基于语义相似性缓存LLM响应来解决这些问题，从而减少了成本和响应时间。

分类

大语言模型 Git客户端

标签

软件工程开发人员工具人工智能 Girub

推荐产品