एस 1
केवल 1000 उदाहरणों के साथ O1-preview का मिलान
प्रदर्शित
2 वोट





विवरण
S1 LLMS के परीक्षण-समय स्केलिंग के लिए एक सरल नुस्खा है, जो केवल 1,000 उदाहरणों और बजट के लिए O1-preview के लिए तुलनात्मक मजबूत तर्क प्रदर्शन को प्राप्त करता है।ओपन-सोर्स मॉडल, डेटा और कोड उपलब्ध है।