浏览器作为互联网的核心入口,正处于十年来最剧烈的范式转移之中。
过去,浏览器的核心职能是“渲染”;现在,随着大模型能力的注入,它的核心职能正在变为“代理”。
这一变化不仅关乎效率的提升,更意味着人机交互逻辑的根本性重构。
技术观察 | 行业前沿
深度解析浏览器智能化变革
你的浏览器,从今天起进化成免费智能体。
谷歌Chrome推出 Gemini Skills,一键生成可复用的技能。
典型场景如下:用户在浏览食谱时,希望 AI 分析营养价值。
以往每次都需要手动复制一长串 prompt,现在仅需保存一次。此后在任何食谱页面上敲个斜杠键,指令即可直接执行。
该功能免费,默认内置在 Chrome 里,不需要购买任何订阅。
Skills,在 AI 时代的地位相当于手机时代的 APP。
但此前要在 Llama 或者 Claude Code 里使用,技术门槛让人望而生畏。
来到浏览器里,使用门槛彻底为 0 了。
以前想让 AI 重复干同一件事,无论是总结文章、分析产品成分,还是对比价格,都得重新输入或者复制粘贴一遍 prompt。
提示词多了,还得找个地方存储。
虽可容忍,但体验割裂。
现在的解法是将这些 prompt 存成 Skill。
在 Gemini 聊天框里敲斜杠(/),或者点击旁边的加号按钮,选择保存过的技能,一键即可运行。
Google 还预置了一个技能库,包含 50 多个现成的技能,涵盖食谱营养计算、护肤品成分分析、YouTube 视频总结等场景。觉得不顺手可以自己修改,改完存下来下次接着用。
跨设备也能同步。登录 Google 账号,在公司电脑上保存的技能,回家打开 Chrome 一样能用。
还有一个杀手级能力:一个技能可以同时读取多个标签页。
比如想对比两个产品的参数,打开两个标签页,跑一个技能,并排对比表就出来了。
But!
凡是涉及日历、邮件这类会产生实际动作的操作,Gemini 会先找用户确认再执行。
总的来说,这些功能并不新,在 Gemini 里都能使用,但是整合到浏览器里,离使用场景总归是更近了。
先是专用的 AI 浏览器出场。
从 Perplexity 的Comet到ChatGPT Atlas。
国内美团旗下光年之外也推出了AI 浏览器 Tabbit。
现在传统浏览器也坐不住了,纷纷往 Agent 方向走。
核心变化就是从“帮你展示网页的工具”,变成了“替你完成任务的助手”。
老牌浏览器Opera 的 Neon 版搞了个叫 Cards 的功能,跟 Chrome 的 Skills 几乎一个思路:
把 prompt 保存下来复用。热门场景包括任务优先级排序、规划电影之夜、找便宜机票。
微软更是被抓包,所谓新出的 Copilot App,其实就是 Edge 套壳,浏览器三个字都快不好意思写在脸上了。
虽然现阶段 AI 浏览器多多少少都有些不完善,但一定是未来的大趋势没跑了。
仿佛回到了上个世纪 90 年代的浏览器大战。
上一次,决定了谁掌握互联网的入口。这一次,改变的是人和互联网交互的方式。
只不过问题是:谁是新的 Netscape,谁是新的 Firefox,Chrome 还会是最后赢家吗?
这场变革的本质,是交互权限的下放。
当浏览器能够理解意图并执行操作,它就不再仅仅是一个窗口,而是一个智能操作系统。
对于用户而言,这意味着从“搜索信息”到“获取结果”的跨越;对于行业而言,则是流量分发逻辑的再次洗牌。
未来的浏览器竞争,将不再局限于渲染速度与插件生态,而是谁能更懂用户的意图,谁能更安全地代理用户的行为。