Allen人工智能研讨所推出MolmoWeb:开源视觉收集智能体新抉择
2026-04-03 10:05:16
人工智能领域迎来重要进展——Allen人工智能研究所(Ai2)正式推出开源视觉网络智能体MolmoWeb。作为Molmo 2模型家族的新成员,该系统以独特的技术路径和开源特性引发关注,其40亿参数与80亿参数两个版本均支持本地部署,为研究人员提供了轻量化的研究工具。
与传统依赖专有模型蒸馏训练的网络智能体不同,MolmoWeb采用创新的数据构建方式。研发团队通过可访问性树技术生成合成轨迹数据,结合3万个人类任务轨迹组成的训练集,其中包含1100多个网站的近60万个子任务。这种混合训练策略使模型既能理解网页结构,又能模拟人类操作逻辑。训练数据还包含220万组问答对,通过让模型回答关于400个网站截图的问题,强化其信息检索能力。
在功能实现层面,该系统具备完整的浏览器操作能力。通过分析网页截图预测行动步骤,可完成导航跳转、表单填写、商品搜索等复杂任务。其操作方式与人类用户高度相似,通过模拟点击、文本输入和页面滚动等交互行为推进任务流程。这种设计使其能够适应不同网站的结构变化,无需针对特定平台进行定制开发。
基准测试数据显示,MolmoWeb在浏览器操作任务中表现优异。其性能超越OpenAI旧版GPT-4o模型,在开放权重模型领域更是一骑绝尘,40亿与80亿参数版本均领先于Fara-7B和GLM-4.1V-9B等同类产品。不过研究人员坦言,当前专有模型在综合性能上仍保持优势,但MolmoWeb的开源特性为学术界提供了重要的研究基线。
该项目团队强调,开源生态的完整性比单一模型性能更重要。此次发布不仅包含模型权重和训练代码(即将上线),还同步开放了评估工具和人类演示数据集。其中人类任务轨迹数据集的规模创下公开数据集新纪录,为后续研究提供了丰富的训练素材。这种全链条开源策略旨在破解当前网络智能体研究中的可复现性难题,推动技术透明化发展。
目前,MolmoWeb已通过Hugging Face和GitHub平台向全球研究者开放下载。其轻量化设计使个人开发者也能在消费级硬件上运行模型,这为中小研究团队参与网络智能体开发提供了可能。随着训练数据的持续扩充和社区贡献的加入,这个开源系统有望催生更多创新应用。
相关阅读
-
存储价钱疯涨友商齐涨价,姜超:红魔在硬抗 老机型还没涨科技前沿 2026-04-03 10:02:39
-
苏宿园区引入50亿工业基金,AI视觉标杆项目同步落地,修建硬科技工业新底座深度解读 2026-04-03 10:00:11
-
2026道通Physical AI大赛总决赛闭幕,具身智能竞技显现AI新生机深度解读 2026-04-03 09:59:34
-
快看看你的,嘴唇发紫博主被粉丝隔空诊出心脏病:确监测到本人心脏停搏了3秒科技前沿 2026-04-03 09:56:01
-
丰台首颁OPC创业搀扶执照 助力“超等集体”开启AI创业新篇章深度解读 2026-04-03 09:54:12
-
联想Yoga Slim 7x海外发布:骁龙芯加持,24小时续航+全C口设计成亮点资讯百科 2026-04-03 09:51:28
-
男人因逗鹦鹉发热一周后住进ICU 大夫:该病症有概率复发科技前沿 2026-04-03 09:50:20
-
淮北市科技馆举行“酷爱科学 创新生长”举动 百名学子共探机械人奥妙深度解读 2026-04-03 09:48:43
-
Nothing CEO改变立场,2027年拟推AI智能眼镜,此前来岁先上新耳塞手机资讯百科 2026-04-03 09:45:24
-
OpenAI关停Sora后收购TBPN播客,结构媒体渠道引行业关注深度解读 2026-04-03 09:42:36