S1
Memadankan O1-Preview dengan hanya 1000 contoh
Pilihan
2 Undi





Penerangan
S1 adalah resipi mudah untuk skala ujian masa LLM, mencapai prestasi penalaran yang kuat yang setanding dengan O1-Preview menggunakan hanya 1,000 contoh & anggaran memaksa.Model, data, dan kod sumber terbuka.