OpenAI推出GPT-5.4模子:具有原生计算机操纵才能 开启智能体新篇
2026-03-07 22:31:53
人工智能领域迎来重要进展,OpenAI正式推出新一代AI模型GPT-5.4。这款模型在计算机原生操作能力上实现突破性进展,成为首个能够直接操控计算机硬件、跨应用执行任务的智能系统。据技术白皮书显示,该模型在专业文档处理、编程开发等场景中展现出显著优势,尤其在电子表格自动化、演示文稿生成等办公场景中效率提升达40%。
在核心技术层面,GPT-5.4引入了全新的计算机视觉-动作映射系统。通过分析屏幕截图,模型能够自主生成精确的键盘鼠标指令序列,实现从网页浏览到软件操作的完整自动化流程。测试数据显示,在处理需要调用多个API的复合任务时,其指令准确率较前代提升27%,操作延迟降低至1.2秒以内。该模型还优化了网络浏览器交互模块,支持更复杂的网页元素识别与动态内容处理。
针对专业用户需求,OpenAI同步推出三款差异化产品。基础版GPT-5.4已集成至Codex编程平台和开发者API,支持实时代码生成与调试;面向企业用户的Thinking版本增加交互式工作流设计功能,允许用户在模型响应过程中动态调整任务参数;顶配版Pro模型则专为金融分析、科研计算等高负载场景优化,在复杂逻辑推理任务中表现尤为突出。
用户体验方面,ChatGPT网页端和安卓应用已率先上线新功能。当用户提出"制作季度销售报表"等复杂需求时,模型会先生成结构化任务大纲,经用户确认后再逐步执行每个子任务。这种分步交互模式使任务修正效率提升60%,避免了传统AI需要完全重新生成的问题。iOS版本更新正在进行最后测试,预计两周内完成推送。
在性能对比测试中,GPT-5.4展现出强大的信息整合能力。面对需要跨10个网页收集数据的调研任务,其多轮搜索策略使关键信息捕获率提升至92%,答案综合质量评分较GPT-5.2提高33%。错误分析显示,新模型在事实性陈述的准确率达到98.7%,创下OpenAI产品新高。目前该模型已开放企业级定制服务,教育机构可申请专属训练数据接口。
技术团队透露,GPT-5.4的突破得益于新型注意力机制与强化学习框架的结合。其训练数据包含超过2000万小时的计算机操作日志,覆盖主流办公软件的137种交互场景。为确保安全性,系统内置了多层级权限控制模块,所有硬件操作均需用户二次确认。OpenAI表示将持续优化模型的可解释性,未来三个月将开放部分核心算法供学术界研究。
相关阅读
-
不会写代码也能用,OpenClaw若何帮通俗人脱节反复任务,提拔效率?深度解读 2026-03-09 14:22:05
-
比特币价格预测:2025 年底 15 万美元还是跌至 8.5 万?关键支撑位分析科技前沿 2026-03-09 14:11:28
-
小米2026届春季校园雇用启动:触及芯片、算法等20职类,需多轮测试科技前沿 2026-03-09 14:08:45
-
AI设计新神器来袭:无需专业技能,一句话解锁巨匠级海报创作资讯百科 2026-03-09 14:05:50
-
又一爆款预定,吉祥银河M7将于3月13日表态:1730km超长续航科技前沿 2026-03-09 14:03:26
-
2026百度Apollo Park参访:解锁智能驾驶手艺落地密码,赋能企业转型资讯百科 2026-03-09 14:00:39
-
国内油价本日将迎年内最大涨幅,网友实拍多地加油站排长队科技前沿 2026-03-09 13:57:03
-
智能办公本怎样选?科大讯飞X5等四款抢手产物功能特点大比拼,帮你找到心头好资讯百科 2026-03-09 13:55:27
-
谁动了稳定币的锚?复盘历年重大脱锚事件,一文汇总科技前沿 2026-03-09 13:54:08
-
交通运输部:本年启动效劳区机制晋级举动 增添马桶位、完美充电设备科技前沿 2026-03-09 13:51:19