用可選的文件/圖像附件評估並比較基於文本的任務的AI語言模型(LLMS)。支持多個提供商(OpenAI,Google,Anthropic,DeepSeek),YAML的自定義任務和HTML/CSV報告。