S1
Matching O1-Preview met slechts 1000 voorbeelden
Uitgelaten
2 Stemmen





Beschrijving
S1 is een eenvoudig recept voor testtijdschaling van LLMS, het bereiken van sterke redeneerprestaties die vergelijkbaar zijn met O1-preview met slechts 1.000 voorbeelden en budget forceren.Open-source model, gegevens en code beschikbaar.