OpenAI 发布 Atlas 浏览器——内置 ChatGPT 的 AI 浏览器

October 22, 2025 • Solar

OpenAI 发布 Atlas:围绕 ChatGPT 构建的全新浏览器

就在刚刚,OpenAI 正式推出了其首款浏览器:ChatGPT Atlas

过去十多年来,Chrome 一直是大多数用户上网的默认入口。但如果现在有一款从底层就内置了 ChatGPT 的 AI 浏览器,还配备完整的记忆和 Agent 功能,你会愿意尝试吗?

这正是 Atlas 想要实现的目标。

不是简单嵌入,而是围绕 ChatGPT 构建

据 OpenAI 介绍,Atlas 不是简单地把 ChatGPT 塞进浏览器,而是从根本上围绕 ChatGPT 设计的浏览器。其核心理念是全方位整合:

随时调用侧边栏:点击"Ask ChatGPT"按钮,即可在任何页面打开 ChatGPT 侧边栏。具备完整上下文理解能力的 ChatGPT 能够读取当前页面的详细内容,帮你总结信息、解释概念,或直接在浏览器窗口内处理任务。

AI 写作辅助:在任何文本输入框中打字时,ChatGPT 会提供实时编辑建议和智能自动补全,大幅提升你的工作效率。

Agent 模式:让 ChatGPT 能够在浏览器中自主完成多步骤任务。

从今天开始,macOS 用户就能使用 Atlas 了。ChatGPT 免费版、Plus、Pro 和 Go 订阅用户都可以下载体验,Windows、iOS 和 Android 版本即将推出。

下载地址:chatgpt.com/atlas

不过,Agent 模式目前仅向 Plus、Pro 和 Business 用户开放,而且仍处于早期阶段——在处理复杂任务时可能会出错。此外,如果你将 Atlas 设置为默认浏览器,还可以获得七天会员试用,享受更高的使用额度。

能记住上下文的记忆功能

Atlas 的记忆功能特别有意思。它能让 ChatGPT 记住你访问过的网站上下文,并在需要时调用这些信息。

例如,你可以这样问:"找出我上周看过的所有招聘信息,并总结一下行业趋势,帮我准备面试。"

这代表了"AI 个人助理"愿景的完整实现——它记得你是谁、你做过什么,还能代替你完成任务。

隐私控制

在隐私方面,你可以完全控制 ChatGPT 在浏览过程中能看到和记住的内容。你可以选择清除特定页面的记录、清空整个浏览历史,或者打开"隐身窗口",在不登录 ChatGPT 的情况下临时浏览。

OpenAI 表示,默认情况下不会将你的浏览内容用于模型训练。

此外,Atlas 支持家长控制功能。如果家长为 ChatGPT 设置了家长控制,这些设置会自动延续到 Atlas。OpenAI 还新增了专门为 Atlas 设计的家长控制选项,比如禁用浏览器记忆或关闭 Agent 模式。

Atlas = Google + ChatGPT?

打开 Atlas 的主页,界面与 ChatGPT 相当相似。

输入查询后,Atlas 会显示一个选择窗口,提供 Google 和 Chat 选项,以及一些具体链接。

顾名思义,Google 选项会重定向到传统搜索引擎页面,而 Chat 选项则像典型的 AI 聊天助手一样,调用 ChatGPT 模型直接提供答案。你在 Atlas 中提出的每个问题都会保存到你的 ChatGPT 账户聊天记录中。

除了对话框中的答案,你还可以切换标签页浏览搜索链接、图片、视频和新闻,大多数选项都保留了跳转到 Google 搜索的功能。

不同模型在回答问题时表现有所差异。

例如,当我询问宠物现在是否能乘坐高铁时,尽管搜索源中有官方信息,GPT-5 Instant 却未能整合出正确答案。相比之下,GPT-5 Thinking 提供了准确且严谨的回复。

交互设计亮点突出

Atlas 的交互设计是一大亮点。

传统 AI 插件通常以侧边栏或悬浮窗形式出现,涵盖 AI 聊天、翻译、网页摘要等功能。

同样,Atlas 的搜索结果页面默认与 ChatGPT 分屏显示。点击右上角的"Ask ChatGPT"就像激活了一个 AI 插件——左侧显示原始网页,右侧可与 ChatGPT 进行多轮对话,而不是传统的单次搜索跳转。

例如,选中一个词,页面右侧就能立即搜索或解释它,或者让它总结文章内容。

在今天上午的直播演示中,OpenAI 员工搜索电影,查看了 Roger Ebert 等网站的影评,然后让 ChatGPT 用五个词以内总结影评内容——这个任务轻松完成。

它甚至可以优化网页文字和标题,整体操作相当流畅。

在今天的演示中,一位 OpenAI 员工在给团队设计师写邮件时,选中了一段文字,点击 ChatGPT 按钮并输入"优化语言"指令。

ChatGPT 当场优化了文字表达。用户可以继续迭代修改,最后点击"更新"按钮替换原始内容。这个功能彻底简化了以往需要在文档和 ChatGPT 之间反复复制粘贴的繁琐流程。

在我的测试中,总结视频内容也没有问题。

Atlas 还支持截图功能。点击右侧的 + 图标,选择"附加屏幕截图"即可上传——我试了一张马斯克的照片,按照这些步骤操作后,它准确识别出了他。

结合侧边栏的 Agent 模式,玩法变得相当有趣。一位用户让 Agent 在绘画网站上画了一朵花——整个过程只用了 4 分钟。 值得一提的是,Atlas 支持通过 @ 调用网页标签。不过与 Dia 可以同时调用多个网页标签不同,Atlas 一次只能调用一个已打开的网页——有点鸡肋,不过后续可能会更新。

Agent 模式:重头戏

Agent 模式是 Atlas 浏览器的旗舰功能。

在今天的演示中,一位 OpenAI 员工计划为 8 人聚餐做饭,打开了一个食谱网页。他询问 ChatGPT 需要准备哪些食材,ChatGPT 自动分析了网页内容,计算了份量,并根据用户之前提到的偏好按超市货架分类整理了购物清单。

用户确认后,Agent 自动打开了 Instacart 购物网站,搜索并将所需商品加入购物车——整个过程只用了两分钟。虽然它没有自动下单,但准备好的购物车已经节省了大量时间,用户可以在审核后决定是否购买。

在另一个工作场景示例中,你可以让 ChatGPT 打开并阅读过往的团队文档,进行新的竞品调研,并整理成团队简报。

在实际测试中,当我提出"帮我在苹果官网购买 iPhone 17 Pro Max"这样的请求时,它在 Agent 模式下执行任务时会显示"接管控制"和红色的"停止"按钮,允许随时介入。

执行速度与 ChatGPT 本身的 Agent 模式没有太大区别。我们手动完成订单可能只需几分钟,但让 Agent 操作却要 19 分钟——这个速度显然不太令人满意。

简而言之,Atlas 的 Agent 模式本质上是将 ChatGPT 的 Agent 功能单独提取出来。同时,你在 Atlas 中的聊天记录也会保存在 ChatGPT 中。

整体体验:惊喜有限

体验 Atlas 后,我的评价是:有惊喜,但不多。

Atlas 给我的感觉就是 Google 搜索和 ChatGPT 对话的融合体。不过,Atlas 保留了 ChatGPT 特色的 Agent 模式,利用 ChatGPT 的能力重新整合了浏览器场景。搜索、理解和任务执行都在一个闭环中完成。

值得一提的是,负责 Atlas 项目的工程师 Ben Goodger 与 Chrome 有着密切联系。

他于 2005 年加入 Google 参与 Chrome 的研发工作,是对 Chrome 贡献最突出的核心成员之一。2024 年他加入 OpenAI,成为 ChatGPT Atlas 浏览器的首席技术负责人。

在过去一段时间里,各家公司陆续推出了自己的 AI 浏览器。

在这场浏览器大战中,Perplexity Comet 更适合极客或高级用户,而基于 Chromium 引擎的 Atlas 门槛更低,也更直接对标 Dia。

有趣的是,Dia 最近刚被企业软件巨头 Atlassian 以 6.1 亿美元收购……所以现在是 Atlas 对战 Atlassian——名字还挺巧。

OpenAI 产品策略演变

回顾 OpenAI 的产品理念,他们之前的策略是打造一个将所有功能集成在一起的超级应用。但无论是最近独立推出的 Sora 应用,还是现在的 Atlas 浏览器,OpenAI 正在不断从 ChatGPT 中分拆功能。

这符合 Sam Altman 在之前采访中表达的产品思路:不同产品在用户心中有不同的"心理定位",强行混合会破坏体验。

简单来说,OpenAI 当前的策略很明确:让 ChatGPT 扮演超级操作系统的角色,而让不同产品各司其职,针对不同场景优化体验。从"超级应用"向"产品矩阵"转型——OpenAI 决心将这条路走到底。