Baichuan-Omni-1.5は、Baichuan AIのオープンソースのOmni-Modalモデルです。テキスト、画像、ビデオ、およびオーディオ入力を処理し、テキストとオーディオを生成し、いくつかのベンチマークでGPT-4O MINIを上回ります。ベースモデルと微調整されたモデルが含まれています。