移动端AI助手的边界正在被一次次重塑。近日,字节跳动旗下“豆包App”的移动端AI助手功能迎来重大更新,其搭载的AI助手“豆包Mobile Assistant”不仅在技术预览阶段就展现出了惊人的能力,更进一步将手机的使用体验推向了新的维度。这不再是一个简单的语音输入框,而是一个能够“看见”、能够“记忆”、能够“执行”的手机“第二大脑”,甚至有能力帮助用户全面掌握和驾驭整部手机的操作。

“On-Device Memory”的升级:它比你更懂你的生活
豆包Mobile Assistant此次最大的亮点在于,率先实现了端侧持久化存储的“记忆”功能。这意味着,它能将用户的生活片段、关键信息,甚至是一些细微偏好,都加密并安全地存储在本地设备上。用户可以随时选择开启或关闭这一功能,充分保障个人隐私。这种本地化存储的模式,不仅带来了极高的效率,更在隐私保护上做到了同类产品中的领先水平。
实际体验下来,其“记忆”能力堪称惊艳:
– 用户只需一句:“我的车停哪儿了?” AI助手便能直接调出上次拍摄的停车位置照片,并附带楼层指引。
– 面对“取件码是多少?”的询问,助手能立刻解析收到的短信,精准报出“5872”。
– 对于“我的高铁座位号?”这类问题,它能秒速关联12306记录,告知:“9车12A靠窗位”。
– 甚至,它还能记住你的偏好,比如“喜欢梵高”,下次规划巴黎行程时,会优先推荐奥赛博物馆。
跨App自动化:一句话,让手机自主完成任务
这无疑是豆包Mobile Assistant中最具颠覆性的能力。AI不再仅仅是响应指令,而是真正能够模拟人类在屏幕上的操作,实现跨应用程序的自动点击、输入和滑动。这种能力将手机的自动化潜力发挥到了极致。
以下是一些令人印象深刻的演示场景:
– 你说:“帮我比价一下这款吹风机在各个平台的最低价。” 豆包瞬间打开淘宝、京东、拼多多、抖音小店,在3秒内给出最低价,并直接停留在支付页面。
– 当需要请假并买票时,对它说:“帮我请三天假,然后买一张回家的火车票。” 它会自主打开钉钉/飞书填写请假申请并提交审核,随后跳转至12306购买火车票,并完成支付。
– 甚至连特斯拉车主也为之惊叹:一句“打开前备箱装点东西”,豆包就能远程控制车辆执行该操作。
实时多模态交互:AI能“看见”并即时回应
当用户拿起一本英文绘本,将摄像头对准它时,豆包Mobile Assistant能够即时激活实时视频交互模式。屏幕上会同步显示中英双语字幕,AI会用流畅的中文或英文讲述故事,并在过程中与孩子进行互动提问。更值得一提的是,它还能根据孩子在屏幕上的实时反应,灵活调整故事情节,带来沉浸式的阅读体验。
Pro Mode:复杂长链任务,一指令全搞定
对于那些意图模糊、步骤繁杂的任务,豆包能够直接激活“Pro Mode”。通过结合GUI模拟点击、API工具调用以及强大的推理能力,它能够处理一些AI此前根本不敢触碰的复杂任务。
以一次巴黎之旅的规划为例:
用户指令:“下个月要去巴黎,帮我标注地图上所有收藏的餐厅,并且帮我订一张包含我最喜欢的展览的博物馆门票。”
豆包的执行过程如下:
1. 读取记忆:发现用户偏爱梵高。
2. 查询当前展览:发现奥赛博物馆有梵高主题展。
3. 打开高德/Google地图,并标注所有保存的米其林餐厅。
4. 跳转至官方网站,成功预订展览门票。
5. 生成完整的行程规划,并推送到笔记应用中。
隐私为先:所有记忆本地化,一键关闭
在此次发布中,字节跳动多次强调了其在数据隐私方面的承诺:所有记忆数据均在用户本地设备上进行处理和存储,绝不会上传至云端。同时,用户可以在设置中随时选择彻底关闭“记忆”功能,真正实现了用户对自身数据的“掌控与信任”。这种对用户隐私的尊重,无疑为AI技术的普及奠定了坚实的基础。