Deepamark
Ferramenta de benchmarking LLM para métricas específicas de tarefas em seus dados
Destaque
94 Votos




Descrição
A IA da DeepMark é uma ferramenta de benchmarking que permite a avaliação de vários modelos de idiomas grandes (LLM) em várias métricas extrínsecas (específicas de tarefas) (por exemplo, precisão, relevância, taxa de falhas, latência etc.) em seus próprios dados, para que seus aplicativos de IA tenham desempenho confiável.