Omniparser V2
Trasforma qualsiasi LLM in un agente di utilizzo del computer
In Evidenza
315 Voti
Tendenza
130 Visualizzazioni


Descrizione
Omniparser "tokenizza" screenshot dell'interfaccia utente da spazi di pixel in elementi strutturati nello screenshot che sono interpretabili da LLMS.Ciò consente all'LLMS di eseguire la previsione della prossima azione basata sul recupero dato un insieme di elementi interaulistici analizzati.