下拉刷新
项目详情
navbar_avatar分享
repo_avatar
HelloGitHub 评分
10.0
1 人评分
解析屏幕的 AI 工具
开源CC-BY-4.0
认领
收藏
分享
21.2k
星数
中文
Jupyter Notebook
主语言
活跃
7
贡献者
180
Issues
组织
.2.0.0
最新版本
2k
Forks
CC-BY-4.0
协议
更多
OmniParser image
这是一款微软开源的屏幕解析工具,能够将用户界面的截图解析为结构化且易于处理的元素。它采用 Python 开发,基于 YOLO、BLIP2 和 Florence 等模型,实现较为精准的图标识别并生成描述性文本,支持与多种主流大语言模型(GPT-4V)集成,适用于开发桌面自动化操作的应用。

评论

评分:
暂无精选评论