लेखक
स्वचालित जीनई मूल्यांकन जो काम करता है
प्रदर्शित
117 वोट





विवरण
AutoArena एक ओपन-सोर्स टूल है जो Genai सिस्टम को रैंक करने के लिए LLM न्यायाधीशों का उपयोग करके हेड-टू-हेड मूल्यांकन को स्वचालित करता है।जल्दी और सटीक रूप से अलग-अलग एलएलएम, रैग सेटअप, या त्वरित विविधताओं की तुलना करने वाले लीडरबोर्ड उत्पन्न करते हैं-अपनी आवश्यकताओं को पूरा करने के लिए कस्टम न्यायाधीशों को फाइन-ट्यून करें।