Omniparser v2
Hidupkan LLM menjadi ejen penggunaan komputer
Pilihan
315 Undi


Penerangan
Skrin UI 'Omniparser' dari ruang piksel ke dalam unsur -unsur berstruktur dalam tangkapan skrin yang dapat diterjemahkan oleh LLMS.Ini membolehkan LLMS melakukan pengambilan semula berdasarkan ramalan tindakan seterusnya yang diberi satu set elemen yang boleh diinterakkan.