S1
Соответствующий O1-Preview с 1000 примеров
Показан
2 Голоса





Описание
S1-это простой рецепт для масштабирования времени тестирования LLM, достигая высоких результатов рассуждений, сравнимых с O1-просмотром, используя только 1000 примеров и бюджета.Модель, данные и код с открытым исходным кодом доступны.