Step-Video-T2Vは、STEPFUNのオープンソーステキストからビデオへのモデルシリーズです。最大204フレームの生成、高圧縮ビデオVAE、およびビデオベースのDPOから品質を向上させるためのビデオベースのDPO。Step-Video-T2V-EvalでSOTAを達成します。