Diepamark
LLM benchmarking tool voor taakspecifieke statistieken op uw gegevens
Uitgelicht
94 Stemmen




Beschrijving
Deepmark AI is een benchmarking-tool waarmee verschillende grote taalmodellen (LLM) kunnen worden beoordeling op verschillende extrinsieke (taakspecifieke) metrieken (bijv. Nauwkeurigheid, relevantie, faalpercentage, latentie, enz.) Op uw eigen gegevens, dus uw AI-apps hebben betrouwbare prestaties.