Omniparser v2
Convierta cualquier LLM en un agente de uso de una computadora
Featured
315 Votos


Descripción
Omniparser "Tokenize" Capturas de pantalla de la interfaz de usuario de los espacios de píxeles en elementos estructurados en la captura de pantalla que son interpretables por LLMS.Esto permite que los LLM realicen una predicción de acción basada en la recuperación de la próxima acción dado un conjunto de elementos interactables analizados.