Omniparser v2
Verwandeln Sie jeden LLM in einen Computer -Use -Agent
Vorgestellt
315 Stimmen


Beschreibung
Omniparser „Tokenizes“ UI -Screenshots aus Pixelräumen in strukturierte Elemente im Screenshot, die durch LLMs interpretierbar sind.Auf diese Weise können die LLMs angesichts einer Reihe von analysierbaren Elementen abgerufen werden.