Autores
Evaluación automatizada de Genai que funciona
Featured
117 Votos





Descripción
Autoarena es una herramienta de código abierto que automatiza las evaluaciones cara a cara utilizando jueces LLM para clasificar los sistemas Genai.Genere de manera rápida y precisa tablas de clasificación que comparen diferentes LLM, configuraciones de trapo o variaciones rápidas: fina jueces personalizados para satisfacer sus necesidades.