思想

將AI模型放在測試中

用可選的文件/圖像附件評估並比較基於文本的任務的AI語言模型（LLMS）。支持多個提供商（OpenAI，Google，Anthropic，DeepSeek），YAML的自定義任務和HTML/CSV報告。