Llav-mini
Llava-mini: imagem e vídeo eficientes grandes modelos multimodais
Apresentou
5 Votos

Descrição
Llava-mini👏 é um LMM eficiente para entendimento de imagem/vídeo usando 1 Token de visão, oferecendo: (1) ⏩ Resposta rápida (40ms por imagem) (2) 🖥️ Sem uso de vram (suporte a três horas de vídeo na GPU de 24 GB).