口論3 405b

    AI2による最新のAIモデル

    注目
    4 投票
    口論3 405bメディア1
    口論3 405bメディア2
    口論3 405bメディア3
    口論3 405bメディア4

    説明

    Tülu3405bは、Tülu3シリーズの最新のものであり、Llama 3.1のようなRivals GPT-4O、およびその他のオープンウェイトポストトレーニングモデルを上回ります。検証可能な報酬(RVLR)からの補強学習を活用すると、405Bパラメーターにスケーリングし、新しいベンチマークを設定します。

    推奨製品