S1
การจับคู่ O1-Preview กับตัวอย่างเพียง 1,000 ตัวอย่าง
เด่น
2 โหวต





คำอธิบาย
S1 เป็นสูตรง่ายๆสำหรับการปรับขนาดเวลาทดสอบของ LLMS การบรรลุประสิทธิภาพการใช้เหตุผลที่แข็งแกร่งเทียบได้กับ O1-Preview โดยใช้ตัวอย่างและการบังคับใช้งบประมาณเพียง 1,000 ตัวอย่างรุ่นโอเพนซอร์ซข้อมูลและรหัสที่มีอยู่