R1-AQA
Xiaomiのdeepseek-r1 Inscection audio
注目
3 投票



説明
Deepseek-R1に触発されたR1-AQAは、Xiaomiのオープンソースオーディオ質問回答モデルであり、Renforce Learning(GRPO)を使用してMMAUのSOTAパフォーマンスを達成しています。
Deepseek-R1に触発されたR1-AQAは、Xiaomiのオープンソースオーディオ質問回答モデルであり、Renforce Learning(GRPO)を使用してMMAUのSOTAパフォーマンスを達成しています。