Omniparser v2
Превратить любой LLM в агент использования компьютера
Рекомендуемые
315 Голоса
Популярные
126 Просмотры


Описание
Omniparser «токенизируют» экраны пользовательского интерфейса из пиксельных пространств в структурированные элементы на снимке экрана, которые поддаются интерпретированию LLMS.Это позволяет LLMS выполнять предсказание следующего действия, основанное на поиске, учитывая набор анализовых элементов, взаимодействующих.