S1

    Corrispondente a O1-preview con solo 1000 esempi

    In primo piano
    2 Voti
    S1 media 1
    S1 media 2
    S1 media 3
    S1 media 4
    S1 media 5

    Descrizione

    S1 è una semplice ricetta per il ridimensionamento del tempo di prova degli LLM, ottenendo forti prestazioni di ragionamento paragonabili a O1-preview utilizzando solo 1.000 esempi e forzatura del budget.Modello, dati e codice open source disponibili.

    Prodotti consigliati