Frettchen
Verweisen Sie und erden Sie irgendwo in jeder Granularität irgendwohin
Empfohlen
145 Stimmen



Beschreibung
Eine neue Art von multimodalem großartigen Sprachmodell (MLLM) von Apple, das sowohl im Bildverständnis als auch in der Sprachverarbeitung hervorragend ist, insbesondere in Bezug auf erhebliche Vorteile beim Verständnis der räumlichen Referenzen.