Autores
Avaliação genai automatizada que funciona
Apresentou
117 Votos





Descrição
O Autoarena é uma ferramenta de código aberto que automatiza avaliações frente a frente usando juízes LLM para classificar os sistemas genai.Geram de maneira rápida e precisa as tábuas de classificação comparando diferentes LLMs, configurações de pano ou variações rápidas-os juízes personalizados ajustam suas necessidades.