Omniparser V2
تحويل أي LLM إلى وكيل استخدام الكمبيوتر
مميز
315 الأصوات
رائج
114 المشاهدات


الوصف
Omniparser 'Tokenizes' لقطات واجهة المستخدم من مسافات البكسل إلى عناصر منظمة في لقطة الشاشة التي يمكن تفسيرها بواسطة LLMs.يمكّن ذلك LLMS من إجراء التنبؤ الإجراء التالي القائم على الاسترجاع بالنظر إلى مجموعة من العناصر القابلة للتفاعل المحفورة.