最近,人工智能领域有一些进展。首先,浏览器大战又开始了。Perplexity 的 Comet 浏览器最近推广力度很大,字节跳动豆包海外版 Cici 的 Dola 浏览器——也就是豆包客户端的海外版——在国外多个市场登顶,OpenAI 也发布了他们的 Atlas。这几款产品明显是冲着 Google Chrome 去的;而 Chrome 也迫不及待地推出了 AI 助手功能。

当前这些 AI 浏览器的主要功能是理解网页内容。OpenAI 的 Atlas 还可以访问和理解浏览记录,以及操作浏览器。有人实测用它访问网页并进行一些交互,例如发帖、发评论等,但目前看起来还只是可用,但还谈不上好用。

目前这些 AI 浏览器的思路都很像,就是为浏览器增加语义理解功能,并让用户打开首页时直接进入自家产品。我认为这是第一阶段。

接下来的第二阶段,应该会融入更多 Agent 能力,让用户可以通过对话让浏览器完成更复杂的任务。例如我说“给某某某写封邮件,感谢他上个项目中提供的技术帮助”,那么浏览器可能就会做这些事情:

  1. 打开邮箱;
  2. 自动输入用户名和密码;
  3. 找到特定联系人;
  4. 结合我和这位联系人过去的通信记录,撰写邮件;
  5. 给我发提醒,要我确认邮件内容;
  6. 确认后发送。

其中关键的是这里:

agent-browser

如果有第三阶段,可能连浏览器都不再需要。毕竟浏览器是包装用户和互联网信息交互界面的容器,今天的浏览器是为网页网址等等现有互联网内容体系设计的,而用户需要的只是完成特定工作,或者获取特定答案。

也许桌面助手可能是第三阶级的战场。无论是完善想法、生成代码或文本、初步设计图片视频等内容,还是获得答案,这个助手都能直接完成。现在有了一些桌面助手,但是还只是在早期阶段。

再接下来,可能电脑、智能手机之类的界面会变成耳机和眼镜组合的方式吧。毕竟这些任务都是通过云端或者边缘服务器完成,用户的设备只是用来输入和输出,简单一点也就够用了。

no-browser


本文由 Get 笔记协助完成。配图由豆包生成。

本周的成果

  • 有几个新发现
  • 工作完成得还可以
  • 公众号和视频发展还行

本周的改变

  • 更多和 Claude Code 合作
  • 提前发布内容
  • 睡得更多

做得还不错

  • 运动量还可以
  • 制作了大量内容
  • 找到了新的方向

做得不太好

  • 体力不大够
  • 精力不充沛
  • 总是觉得累

下周的目标

  • 继续多睡觉
  • 学一些新东西
  • 继续多运动