Furetto
Fare riferimento e macinare qualsiasi cosa ovunque in qualsiasi granularità
In Evidenza
145 Voti



Descrizione
Un nuovo tipo di modello di linguaggio di grandi dimensioni multimodali (MLLM) di Apple che eccelle sia nella comprensione dell'immagine che nell'elaborazione del linguaggio, in particolare dimostrando vantaggi significativi nella comprensione dei riferimenti spaziali.