S1

    Combinando O1-Preview com apenas 1000 exemplos

    Destaque
    2 Votos
    Mídia 1 de S1 - Combinando O1-Preview com apenas 1000 exemplos
    Mídia 2 de S1 - Combinando O1-Preview com apenas 1000 exemplos
    Mídia 3 de S1 - Combinando O1-Preview com apenas 1000 exemplos
    Mídia 4 de S1 - Combinando O1-Preview com apenas 1000 exemplos
    Mídia 5 de S1 - Combinando O1-Preview com apenas 1000 exemplos

    Descrição

    O S1 é uma receita simples para o escala de LLMs no tempo de teste, alcançando um forte desempenho de raciocínio comparável à pré-revisão de O1, usando apenas 1.000 exemplos e forçamento do orçamento.Modelo, dados e código de código aberto disponíveis.

    Produtos Recomendados