QWEN2.5-OMNIは、Alibaba CloudのQwenチームによるエンドツーエンドのマルチモーダルモデルであり、テキスト、画像、オーディオ、ビデオを理解しています。テキストと自然ストリーミングスピーチを生成します。