Deepmark AI는 다양한 외적 (작업 별) 메트릭 (예 : 정확도, 관련성, 실패율, 대기 시간 등)에서 여러 대형 언어 모델 (LLM)을 평가할 수있는 벤치마킹 도구이므로 AI 앱은 신뢰할 수있는 성능을 갖습니다.