|
“2025 is going to be the year of Agent。” 在今天凌晨的召开的发布会上,OpenAI 发布了全套 Agent 开发套件,你还因为没有 Manus 邀请码而感到焦虑嘛?不要担心,手搓 Manus 指日可待!
先简单总结一下重点内容:
1、Responses API:今天抛弃老 API 虽然原本的 Chat Completions API 并不会下架,但 Pesponses API 既兼容老 API,又会持续更新新功能,除了老 API 没有的Web 搜索、文件搜索、计算机使用(注意一下)功能,未来还将推出音频和代码解释器,完全没理由不用心的。 只需要稍微修改下代码格式,就可以成功调用了。
简单来说,Responses API 简洁强大、内置工具、统一设计、直观清晰……优点有点多,其实 2023 年 OpenAI 就搞了一个用于 Agent 开发的 API,又贵又不好用,如今也算是走向正轨了。 2、Web Search:啥都能配置,就是略贵 OpenAI 的 API 终于支持搜索了!国家、时区、搜索量等,可以配置的东西还不少,就是价格看起来有些贵,Google Search 的价格是 5 美元 1000 次,Bing Search 的价格是 20 美元 1000 次,但 Open AI 的价格最便宜的 25 美元 1000 次,最贵的达到了 50 美元 1000 次。
3、File Search:版本更新 文件搜索不是新功能,只是一次更新,如今支持包括常见的 .pdf、.docx、.pptx 等 21 种格式(包括 utf-8、utf-16 以及 ascii),价格调用 1000 次 2.5 美元,存储 1 GB 每天 0.1 美元。
4、CUA:截图就能自动化 Computer Use Agent 可以让 AI 通过截图界面理解来执行交互操作,从而实现自动化功能,它可以识别鼠标单击、双击、滚动、坐标、路径,输入文本、等待、组合键、截图等共 9 种行为,然后 CUA 进行自动的执行,就能操作电脑了。
现在 GitHub 已经有项目了,可以去试试。 https://github.com/openai/openai-cua-sample-app 5、Agents SDK:硬菜来咯 直接上 GitHub 地址:https://github.com/openai/openai-agents-python
这是一个支持 multi-agent 的框架,只要符合 OpenAI Chat Completions API 的模型都能用,也就是说 DeepSeek 也能用,这想象空间就太大了。 或许对我们这些普通用户来说,这次发布会并不那么“亲切”,但 Agent 套件的发布,必将快速改变我们的日常生活,或许在某个被智能体服务的日子里,你会想起今天清晨的第一抹阳光。 |
IT百科
网友评论
聚超值•精选


