热搜词:

炸圈的ChatGPT Agent , 到底有哪些能耐? 能不能替代普通牛马?

AI一天,人间一年。

OpenAI又深夜开大了,这次是智能体:ChatGPT Agent。

从浏览网页到写PPT、改Excel,再到跑代码、下单购物、填表预约…

只需一句话,ChatGPT Agent 就能在你的电脑里全程自动完成。

ChatGPT Agent把Operator(能点、能输、能上网)和Deep Research(会找资料、会深度总结)的功能结合起来。

再加上一台随开随用的虚拟电脑(可视化浏览器+文本浏览器+终端+API),在一次对话里自由切换「思考」和「操作」,真正实现端到端的任务执行。

这次信息量很大,这个Agent确实能干很多事。

①多工具协作:自动选择最优路径。

GUI浏览:操作让你和GUI页面,点击、滚动、输入、上传文件;

文本浏览:快速爬取、解析网页做轻量推理;

终端窗口/API:写代码、跑脚本、调用外部接口;

连接器:安全只读接入Gmail、GitHub、Google Drive等SaaS软件。

基于这些协作,你可以5分钟完成「旅行规划+机票酒店预订+行程 Excel」,也可以自动抓取研报、生成10页PPT、并附财务数据图表。

②随时插话:保持人机协作

任务跑着跑着,可以中断→补充要求→继续,无需重来。

涉及支付、删除文件、登录账号等敏感操作时,先向你确认。

出现长时间卡顿,可让Agent给出进度摘要或提前交付部分结果。

③安全与可控:这次拉满了

这可能是人类最担心的之二:把重要的事交给智能体,万一办砸了怎么办。

ChatGPT Agent提供了以下措施↓

用户主权优先:关键动作前确认,可一键暂停、接管、终止。

防对抗 & 滥用:对提示注入、钓鱼链接进行实时检测与拒绝。

数据私有:远程浏览器输入内容不留存,浏览数据、Cookie 可随时清除

漏洞赏金:OpenAI 推出专门 bounty 计划,鼓励社区共同找漏洞。

总之,从Operator到Deep Research再到ChatGPT Agent,OpenAI 正在给「能思考的脑」装上「能行动的手」。

当AI有了手,嘿嘿,是不是我们牛马打工人就能解放双手了呢?

当然,看完这个,更多人会说,就这就这?这东西怎么这么“Manus”?

Manus画过的饼OpenAI也来画一遍?

而且这些Demo还不如Manus惊艳…

嘿嘿,这恰恰是Manus的问题,也是所有通用型智能体的问题。

在Manus刷屏那几天我们就说,这类通用智能体未来一定会被大模型厂商直接内化和集成。(浏览网页、写PPT、做Excel、下单、填表、订票、撸代码,太“通用”啦。)

ChatGPT Agent现在还不足够强大,但是狼已经来了,当然Manus不需要我们担心,他已经跑路了。

必须要给所有做通用智能体的玩家敲个警钟,还是要做行业智能体。

参考刚拿到143亿天价种子轮公司TML要干的事,面向企业的AI定制。否则你没有门槛,必将被大模型巨头的内建智能体卷死在沙滩上。