QWQ-32B
Raisonnement R1 correspondant mais 20 fois plus petit
En vedette
148 Votes




Description
QWQ-32B, de l'équipe Alibaba Qwen, est un nouveau raisonnement open source 32B réalisant un raisonnement de niveau Deepseek-R1 via l'apprentissage en renforcement à l'échelle.Comprend un "mode de réflexion" pour les tâches complexes.