S1
Previsión O1 coincidente con solo 1000 ejemplos
Featured
2 Votos





Descripción
S1 es una receta simple para la escala de tiempo de prueba de LLMS, logrando un fuerte rendimiento de razonamiento comparable a la previsión O1 utilizando solo 1,000 ejemplos y forzamiento de presupuesto.Modelo de código abierto, datos y código disponibles.