02
17

微软OmniParser最新版本可将DeepSeek等模型转化为计算机智能体

2025-02-17 08:56分享至
2月17日,根据微软官网,微软日前发布视觉Agent解析框架OmniParser最新版本V2,可将OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)、Anthropic(Sonnet)等大模型,转化为“计算机使用智能体”(Computer Use Agent)。相比前代版本,OmniParser V2在检测更微小可交互元素时精度更高、推理速度更快。具体而言,V2通过使用更大规模的交互元素检测数据集和图标功能描述数据进行训练,并通过缩小图标描述模型的输入图像尺寸,推理延迟较前代降低60%。(界面)原文链接

下一篇

“5G消息(RCS)的发展低于预期。”业内人士在接受采访时,提到了背后的一些原因——终端支持率不足、商业模式单一、场景开发不足。终端方面,苹果手机iOS 18.1系统正式支持5G消息功能,标志性意义显著。“苹果、安卓在全球多个国家广泛支持5G消息功能,标志着终端消息服务已成功升级到富媒体消息,具有重要里程碑意义。”上述业内人士判断,接下来的一年,是5G消息应用在苹果生态成熟发展的关键期,并为国内安卓、鸿蒙生态树立标杆。(证券时报)

2025-02-17

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业