ओमनीपर्सर वी 2
किसी भी एलएलएम को कंप्यूटर उपयोग एजेंट में बदल दें
प्रदर्शित
315 वोट


विवरण
Omniparser of पिक्सेल रिक्त स्थान से UI स्क्रीनशॉट को स्क्रीनशॉट में संरचित तत्वों में टोकन करता है जो LLMS द्वारा व्याख्यायित हैं।यह एलएलएम को पुनर्प्राप्ति आधारित अगली एक्शन भविष्यवाणी करने में सक्षम बनाता है जो पार्सडेड इंटरैक्टेबल तत्वों का एक सेट दिया गया है।