思想

将AI模型放在测试中

用可选的文件/图像附件评估并比较基于文本的任务的AI语言模型（LLMS）。支持多个提供商（OpenAI，Google，Anthropic，DeepSeek），YAML的自定义任务和HTML/CSV报告。