S1
Corrispondente a O1-preview con solo 1000 esempi
In primo piano
2 Voti





Descrizione
S1 è una semplice ricetta per il ridimensionamento del tempo di prova degli LLM, ottenendo forti prestazioni di ragionamento paragonabili a O1-preview utilizzando solo 1.000 esempi e forzatura del budget.Modello, dati e codice open source disponibili.