向量缓存

    有效LLM查询缓存的Python库

    精选
    23 投票
    向量缓存 - 有效LLM查询缓存的Python库媒体1

    描述

    随着AI应用程序的吸引力,使用大语言模型(LLM)的成本和延迟可能会升级。VectorCache通过基于语义相似性缓存LLM响应来解决这些问题,从而减少了成本和响应时间。

    推荐产品