R1-AQA

    เสียง Inscepti Deepseek-R1 ของ Xiaomi

    เด่น
    3 โหวต
    R1-AQA media 1
    R1-AQA media 2
    R1-AQA media 3

    คำอธิบาย

    R1-AQA ซึ่งได้รับแรงบันดาลใจจาก Deepseek-R1 เป็นรูปแบบการตอบคำถามเสียงโอเพนซอร์ซจาก Xiaomi บรรลุประสิทธิภาพ SOTA ใน MMAU โดยใช้การเรียนรู้เสริมแรง (GRPO)

    ผลิตภัณฑ์ที่แนะนำ