Profundo

Herramienta de evaluación comparativa LLM para métricas específicas de tareas en sus datos

Destacado

94 Votos

Visitar el sitio web

Descripción

Deepmark AI es una herramienta de evaluación comparativa que permite la evaluación de varios modelos de lenguaje grande (LLM) en varias métricas extrínsecas (específicas de tareas) (por ejemplo, precisión, relevancia, tasa de fracaso, latencia, etc.) en sus propios datos, para que sus aplicaciones de IA tengan un rendimiento confiable.

Categorías

Modelos de Lenguaje Clientes Git Software de inteligencia empresarial

Etiquetas

Herramientas para desarrolladores Inteligencia artificial Girub

Descripción

Categorías

Etiquetas

Productos recomendados