R1-AQA
เสียง Inscepti Deepseek-R1 ของ Xiaomi
เด่น
3 โหวต



คำอธิบาย
R1-AQA ซึ่งได้รับแรงบันดาลใจจาก Deepseek-R1 เป็นรูปแบบการตอบคำถามเสียงโอเพนซอร์ซจาก Xiaomi บรรลุประสิทธิภาพ SOTA ใน MMAU โดยใช้การเรียนรู้เสริมแรง (GRPO)
R1-AQA ซึ่งได้รับแรงบันดาลใจจาก Deepseek-R1 เป็นรูปแบบการตอบคำถามเสียงโอเพนซอร์ซจาก Xiaomi บรรลุประสิทธิภาพ SOTA ใน MMAU โดยใช้การเรียนรู้เสริมแรง (GRPO)