S1

    Corrispondente a O1-preview con solo 1000 esempi

    In Evidenza
    2 Voti
    S1 - Corrispondente a O1-preview con solo 1000 esempi media 1
    S1 - Corrispondente a O1-preview con solo 1000 esempi media 2
    S1 - Corrispondente a O1-preview con solo 1000 esempi media 3
    S1 - Corrispondente a O1-preview con solo 1000 esempi media 4
    S1 - Corrispondente a O1-preview con solo 1000 esempi media 5

    Descrizione

    S1 è una semplice ricetta per il ridimensionamento del tempo di prova degli LLM, ottenendo forti prestazioni di ragionamento paragonabili a O1-preview utilizzando solo 1.000 esempi e forzatura del budget.Modello, dati e codice open source disponibili.

    Prodotti Consigliati