Llav-mini
Llava-mini: image et vidéo efficaces de grands modèles multimodaux
En vedette
5 Votes

Description
Llava-MinI👏 est un LMM efficace pour la compréhension de l'image / vidéo à l'aide de 1 jeton de vision, offrant: (1) ⏩ Réponse rapide (40 ms par image) (2) 🖥️ Utilisation de VRAM sans (support de la compréhension vidéo de 3 heures sur 24 Go GPU).