Una disputa 3 405b
El modelo de IA más nuevo de AI2
Destacado
4 Votos




Descripción
Tülu 3 405b, el último de la serie Tülu 3, supera a Deepseek-V3, rivaliza GPT-4O y otros modelos post-entrenamiento de peso abierto como Llama 3.1.Aprovechando el aprendizaje de refuerzo de las recompensas verificables (RVLR), escala a parámetros 405b, estableciendo nuevos puntos de referencia.