Profundo
Herramienta de evaluación comparativa LLM para métricas específicas de tareas en sus datos
Destacado
94 Votos




Descripción
Deepmark AI es una herramienta de evaluación comparativa que permite la evaluación de varios modelos de lenguaje grande (LLM) en varias métricas extrínsecas (específicas de tareas) (por ejemplo, precisión, relevancia, tasa de fracaso, latencia, etc.) en sus propios datos, para que sus aplicaciones de IA tengan un rendimiento confiable.