Omniparser v2
Verwandeln Sie jeden LLM in einen Computer -Use -Agent
Empfohlen
315 Stimmen
Trending
130 Aufrufe


Beschreibung
Omniparser „Tokenizes“ UI -Screenshots aus Pixelräumen in strukturierte Elemente im Screenshot, die durch LLMs interpretierbar sind.Auf diese Weise können die LLMs angesichts einer Reihe von analysierbaren Elementen abgerufen werden.