Alibaba QwenチームのQWQ-32Bは、スケーリングされた強化学習を介してDeepseek-R1レベルの推論を達成する新しいオープンソース32B LLMです。複雑なタスクの「思考モード」を備えています。