微软发布了 OmniParser V2.0,这是一个将 UI 截图转换为结构化格式的解析工具,旨在提升基于 LLM 的 UI 代理性能,帮助用户理解和操作屏幕上的信息。该工具包含两个数据集:一个用于检测可交互图标,另一个用于描述图标功能。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验