Omniparser V2

    任意のLLMをコンピューター使用エージェントに変えます

    特集
    315 投票
    Omniparser V2 media 2
    Omniparser V2 media 3

    説明

    Omniparserは、LLMSが解釈できるスクリーンショットのピクセルスペースからUIスクリーンショットを「トークン化」します。これにより、LLMSは、解析された相互作用可能な要素のセットを考慮して、次のアクション予測に基づいて検索することができます。

    推奨製品