最牛的AI应用开发者 都在做AI浏览器

内容摘要The Browser Company是一家明星且特别的公司。它创办于2019年,base在纽约,累计融资1.28亿美元,估值超过5.5亿美元。核心产品Arc浏览器,以颠覆性的产品体验吸引了上百万高粘性用户,在硅谷极客们眼中,Arc是过去五

The Browser Company是一家明星且特别的公司。

它创办于2019年,base在纽约,累计融资1.28亿美元,估值超过5.5亿美元。

核心产品Arc浏览器,以颠覆性的产品体验吸引了上百万高粘性用户,在硅谷极客们眼中,Arc是过去五年最酷的浏览器产品,有着远超Chrome等传统浏览器的产品设计。

但在2024年春天完成了5000万美元融资之后,他们悄悄作出了一个决定——将团队重心转向新产品“全新设计的AI浏览器”的研发,原产品Arc仅保持维护,用户期待的Arc 2.0也许再也不会有了。

半年后,新产品Dia浏览器官宣。创始人Josh Miller说,他们对这个demo中的新产品,有数不清的good idea。

现在,Dia终于开启了邀请码公测。

一、为AI重新设计浏览器

这支产品创新能力很强的团队,一开始就目标明确:从头开始,打造一款原生AI浏览器。

为了做到这一点,开发团队认为必须“推翻重来”;即使他们倾注数年心血的Arc浏览器已经初步形成规模效应。开发团队从未公布过Arc浏览器的用户总量,但仅Windows版本上线首月就吸引了20万用户,iOS端App Arc Search上线之后用时三个月日活跃用户数量就突破了10万。

虽然Arc浏览器堪称“古典浏览器时代”的最高潮,但它无力对AI Agent对浏览器带来的这场革命产生关键影响;开发团队也曾试图在Arc浏览器中整合一部分AI功能,但仍然无力改变Arc浏览器本身并不是为AI而生这一事实。

Dia官网上的一条信息写道:Dia并非仅仅是在现有浏览器上添加AI功能,而是将AI作为核心构建理念,旨在打造一个全新的、由AI驱动的浏览环境。

开发团队认为,AI不应该只是一个应用或一个按钮,而应该成为浏览器底层的能力。

Dia作为从一开始就“深度整合AI能力进入浏览器中”的产品,实际体验能带来哪些改变?

二、极简但优雅的产品体验

表面上,Dia浏览器是一款同时集成了GPT-4o与Gemini Flash 2.0的多模态AI浏览器,支持个性化对话、视频分析与多任务处理,并且免费、无使用限制。

但如果你已经或曾经是Arc浏览器的用户,在打开Dia的首页,你就能通过Dia首页,意识到两款浏览器产品迥然不同的开发逻辑,即从“复杂极客工具”到“极简AI入口”的产品逻辑巨大变化。

作为开发团队对“AI浏览器应该是什么样”的一个实现方式,Dia在首页的一个角落加入了“Personalize Dia”功能,你可以通过输入包括“你崇拜谁?”“你喜欢怎样的学习方式?”以及“Dia的回答风格”三个角度,来帮助Dia快速理解用户本身,将AI快速设定为用户更熟悉的一个形态。

无论是Steve Jobs的创新精神,还是《The Atlantic》、《NYT》、《New Yorker》等媒体的视角,用户的选择都将潜移默化地影响Dia的知识结构搭建与思考方式,使其在某种程度上成为用户所崇拜对象的“投影”。

在AI融入浏览器的浪潮中,Dia团队并非简单地将AI生硬地塞入既有的框架,而是试图从用户与AI的交互入手,构想“AI浏览器”的个性化定制方案。

更进一步,Dia提供了多达20档的“Dia的回答风格”强度调节。这就像早期的操作系统允许用户调整字体大小和界面主题一样,Dia让用户能够精细地控制AI的表达方式和情感色彩。默认的中间档位提供了一个平衡点,而用户可以根据自己的喜好,微调Dia的“个性”。

简单设置好Dia的风格后,你能感受到开发团队在“让AI能说人话”这件事上,一定下足了功夫。“舒服”是最准确的描述。

对于经常使用浏览器打开众多窗口、处理复杂工作的用户,Dia浏览器的@Tabs中包括网页内容分析、自动推荐提示词等功能,确实能有效帮助用户理清思路、用最简单的方式梳理复杂内容的结构脉络。

在此前开发团队的早期演示中,Dia还能帮助用户完成更加复杂的任务,例如自动将邮件中的商品添加到亚马逊购物车中——彼时AI Agent概念还没有兴起。而在现阶段版本的体验中Dia对网页读取的颗粒度非常细致,但同时也更加强调借助AI能力,大幅简化用户界面和操作流程,通过设计上的“克制”来获取更加高效的使用体验。

Dia预示着未来的AI浏览器,将不再是冰冷的工具,而是能够理解用户、贴近用户,甚至在某种程度上成为用户在数字世界中的延伸。

这与Manus团队为AI单独打造浏览器的思路异曲同工,都指向一个核心目标:让AI更好地服务于人类,同时以更自然、更个性化的方式融入我们的数字生活。

三、与Manus不同的产品哲学

对于原生AI应用来讲,浏览器作为平台让模型能力可以更深入地理解用户的浏览习惯和上下文,从而提供更个性化和高效的服务。快速地将AI Agent概念中的产品交付给用户,因此今年的情况,实际已经变成了“优秀的AI应用开发者,会打造自己的浏览器”。

即使过去三十年互联网领域已经发生了数次重大的技术变迁,但浏览器仍然是构成当代互联网最前沿用户体验的重要部分。但这也让浏览器市场变得“极端保守”。

或许会有一些极客用户,会为了屏蔽广告等功能去尝鲜一款新浏览器工具,但绝大部分用户并不会为了一点新鲜感,放弃自己原本已经熟悉的体验——这才是让Chrome过去十余年一家独大的根本原因。

如果说Dia浏览器现阶段哪一点最让人印象深刻,或许仍然是“新鲜感”。但它的新鲜感与充满“极客工具箱”属性的Arc又有着明显不同,Dia浏览器更像是开发团队打造的一片“适合AI应用生长的土壤”。

这个思路与此前打造出Manus AI的Monica.im团队异曲同工:在开发Manus的过程中,Monica.im曾经一度想打造一款AI浏览器,但他们很快遇到了一个问题:AI和人类共用一个浏览器界面,体验极差。

最终Monica.im的解决方案是:为AI单独打造一款浏览器,让人与AI交互,AI操作浏览器完成执行命令。作为基于浏览器的Agent而存在,它需要用户在“想用AI”的时候使用。

针对同一个问题,在浏览器交互上有着极强创新能力的Dia团队,给出的答案是:在AI能够更好地融入浏览器之后,重新设计浏览器的交互逻辑。

虽然The Browser Company声称自己“不做App”,但浏览器本质上仍然是一个巨型App。除了Dia这样的挑战者,包括谷歌、Opera等在上一个时代掌握浏览器入口的选手,也在主动拥抱AI Agent给浏览器带来的转型机会。

在当前AI应用发展处于早期,并未提供手机系统级别的生态入场机会的前提下,无论是The Browser Company还是Perplexity的Comet,都选择了浏览器作为布局LLM深度交互生态的“船票”。

由于浏览器这个形态的产品自承接端侧用户信息以及互联网入口的属性,因此一些硬件/手机OS厂商,都又在这个领域尝试突破,落地一部分AI Agent的能力,因此这个赛道会迅速变得“百花齐放”,也会是AI Agent短期内最让人兴奋的突破口之一。

问题实际上变成了:对于创业公司来讲,AI浏览器是否已经是现有生态下的AI App终点?

四、创业公司和大厂都在做浏览器回到一个根源的问题,“浏览器”是什么?

它是互联网历史的第一个“入口”。PC互联网的最初期,以网景、Mosaic为代表的图形界面浏览器改变了用户访问互联网的方式,微软IE浏览器更是因为反垄断案改变了科技竞争格局。

随后,Office、Adobe等桌面软件一度兴起,占据大量市场份额,但Web端依然出现了G-Suite和Canva、Figma、Notion等新锐产品,随着SaaS模式在全球市场的成功,最终网页应用和移动App成为了开发者top 2的选择。

至少在桌面平台上,浏览器是聚拢价值的金山。用户浏览信息(新闻、博客、流媒体),执行操作(邮件、创作、视频会议),所有这些,在大模型时代,我们称之为context(上下文)。

这意味着,AI有极大的发挥空间,以及被augmented的机会。

如果你关注过去数月关于Agentic AI的讨论,你会发现browser浏览器作为产品形态,频繁地被讨论和使用。

Manus内置了浏览器,Opera发布AI助手Aria,Perplexity和OpenAI都在做浏览器产品,当然还有The Browser Company的新产品Dia。

一些原本定义并非浏览器的产品,也选择了浏览器的形态。比如豆包,它的桌面端基于Chromium开发。另一家大厂也有类似形态的产品——夸克的桌面端。这两家大厂的产品,功能极其全面,且用户量远远领先创业团队的新产品,最重要的,它们都是各自集团AI to C的重点发力产品。

还有Claude的桌面端应用,基于Electron框架的PWA应用——还是Chromium。(当然Claude大概率是个暂时性的产品,他们应该没准备一辈子用这个形态。)

部分AI浏览器或基于浏览器的AI产品

还有很多厂商在琢磨怎么让AI能够更好地“使用浏览器”,比如刚刚完成融资的browser-use,以及Amazon刚刚发布的Nova Act SDK,这些项目更多在框架层,为开发者提供调取浏览器的服务。

从AI接入方式的层面上,AI浏览器产品大多可以分为三类:

传统浏览器+AI,通常以copilot的形式存在,最早有Mircosoft Edge,以及Chrome上包括Monica.im在内的各种浏览器插件。让AI built-in浏览器的更底层,有更多权限。比如Arc Max能够整理tab,Opera Aria能够像Manus一样执行操作,Dia未来能够拥有记忆,知道用户拿浏览器做过什么。豆包和夸克的桌面端产品,看起来“上网”不再是最核心的feature——就像打电话之于智能手机。OpenAI和Perplexity正在研发的产品,大概率也在这个范畴内。打造一款给AI用的浏览器。这是Manus主要的产品哲学,他们让用户与AI交互,AI去操作跑在虚拟机上的浏览器,是个更加终局的解决方案。

功能性的roadmap是明确且共识的:

最开始,AI处理一个信息单元,读取单个网页,阅读文字,抽取YouTube字幕,或者理解用户当前所处的网页环境;

然后,context延展,AI能够理解更多的信息,比如其他已经打开的Tab,甚至能够记住用户过去打开的网页、执行的操作;

最终,AI必然会代替用户执行操作,比如挑选商品、发送邮件、写文档、做设计,所有用户在浏览器内能做的事,AI都可以执行。

这是一个非常清晰的,能够颠覆过去浏览器体验的机会。

只是我们还不知道,这个机会属于拿到5000万美元融资的The Browser Company,还是传统巨头Chrome和Edge,又或者,下一个像Manus一样的创业新秀会横空出世,将想象中的用户体验变成现实。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备2021030705号-9