Deepamark

データ上のタスク固有のメトリック用のLLMベンチマークツール

注目

94 投票

ウェブサイトを訪問

説明

Deepmark AIは、さまざまな外因性（タスク固有の）メトリック（例：精度、関連性、故障率、遅延など）でのいくつかの大規模な言語モデル（LLM）の評価を可能にするベンチマークツールであるため、AIアプリは信頼できるパフォーマンスを持っています。

カテゴリ

大規模言語モデル Gitクライアントビジネスインテリジェンスソフトウェア

タグ

開発者ツール人工知能ギルブ

推奨製品