01
28

阿里云通义开源Qwen2.5-VL,视觉理解能力全面超越GPT-4o

2025-01-28 11:18分享至
36氪获悉,今天凌晨,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,夺得十余项权威评测中的视觉理解冠军,全面超越GPT-4o与Claude3.5。新的Qwen2.5-VL能够更准确地解析图像内容,突破性地支持超1小时的视频理解,无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。

下一篇

泰铢兑美元汇率连续第二个交易日下跌,此前泰国财政部长再次敦促央行降息。美元/泰铢在过去两天内一度上涨0.9%,至33.901,为1月6日以来的最大两日涨幅。1月27日,在曼谷举行的一个论坛上,泰国财长Pichai Chunhavajira向央行提出了最新建议,即降低借贷成本,并让泰铢“更具竞争力”,以促进泰国的主要出口和旅游业。(新浪财经)

2025-01-28

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业