Deepamark
LLM Benchmarking Tool pour les mesures spécifiques à la tâche sur vos données
En vedette
94 Votes




Description
Deepmark AI est un outil d'analyse comparative qui permet l'évaluation de plusieurs modèles de langage grand (LLM) sur diverses mesures extrinsèques (spécifiques à la tâche) (par exemple, précision, pertinence, taux d'échec, latence, etc.) sur vos propres données, donc vos applications AI ont des performances fiables.