Llav-Mini
Llava-Mini: Imagen eficiente y video grandes modelos multimodales
Featured
5 Votos

Descripción
Llava-Mini👏 es un LMM eficiente para la comprensión de la imagen/video utilizando 1 token de visión, ofreciendo: (1) ⏩ Respuesta rápida (40 ms por imagen) (2) 🖥️ Uso de VRAMless (admite una comprensión de video de 3 horas en la GPU de 24 GB).