Cohereによる推論をコマンドすることは、エンタープライズの推論タスクの高度なモデルです。プライベート展開用に設計されており、単一のH100で実行中にGPT-OSS-120Bなどのモデルよりも優れています。ユーザーが制御するトークン予算を使用すると、パフォーマンスとコストのバランスをとることができます。