用可选的文件/图像附件评估并比较基于文本的任务的AI语言模型(LLMS)。支持多个提供商(OpenAI,Google,Anthropic,DeepSeek),YAML的自定义任务和HTML/CSV报告。