Autores
Evaluación automatizada de Genai que funciona
Destacado
117 Votos
Tendencia
128 Vistas





Descripción
Autoarena es una herramienta de código abierto que automatiza las evaluaciones cara a cara utilizando jueces LLM para clasificar los sistemas Genai.Genere de manera rápida y precisa tablas de clasificación que comparen diferentes LLM, configuraciones de trapo o variaciones rápidas: fina jueces personalizados para satisfacer sus necesidades.