从豆包助手说起手机智能体还有哪些待解难题？

来源：21世纪经济报道

媒体

2025-12-03 16:56:59

（原标题：从豆包助手说起手机智能体还有哪些待解难题？）

21世纪经济报道记者王俊

12月，行业最重磅的一条消息是字节跳动要和中兴造手机。但很快，字节出面解释，没有开发手机的计划，目前只是在与多家手机厂商洽谈AI助手合作。

这轮合作的核心是豆包手机助手。在媒体实测中，手机AI助手已经不再是一个跑在前台的 App，而更像能接管整部手机的“数字影子”：跨平台比价点外卖、搜小红书做攻略、自动回微信，甚至能替用户打游戏。

这些能力的共同技术前提是，AI拿到了系统级别的手机权限。业内专家告诉21记者，为豆包助手配备独立的物理按键、语音唤醒、识屏能力和跨第三方App调用等能力，都需要操作系统级别的支撑，这是普通App无法企及的等级。也印证了字节公开所说的合作发生在系统层面，而非简单的应用层。

但智能体越往手机系统深水区走，数据问题越难回避。“通过屏幕能读聊天记录，个人隐私怎么办？”“隐私问题很难解决，权限要的太大了”，类似评论在豆包手机助手的留言区多次出现。

字节显然也意识到了这一点。《豆包手机助手隐私安全白皮书》开篇便写道，⽤户的数据与隐私安全性始终是⾸要考虑因素之⼀。12 页的详细篇幅，足以说明手机智能体的敏感程度。

这不仅是豆包，而是所有手机助手都面临的问题。接下来值得观察的，除了手机助手们的性能和市场渗透率，还有AI 时代的“系统级权限”该如何以合规方式落地。

从去年开始，手机助手（智能体）一句话点外卖、订餐厅等功能业已上线，是OPPO、vivo、荣耀等手机厂商主打的宣传卖点，但当时噱头远远大于性能，许多操作还有失败、延迟、误触问题。

到了今年10月底，在OPPO、vivo、荣耀更新的最新系统中，智能体已经进一步升级，长记忆、比价、抢票等能力纷纷上阵。

行业的判断越来越清晰：手机智能体可以直接与用户交互，提供新的服务形态，是新的流量入口。对岸的马斯克最近甚至断言，“未来App将彻底消失，所有交互由AI实时生成、预测与完成。”

国内的数据已经能看到这一趋势。Quest Mobile报告显示，自2024年9月起，六大手机厂商的AI助手规模一年内合计增长0.65亿，同比增长13.9%；到了今年9月，手机厂商AI助手总用户规模已经突破5.35亿。

OPPO、vivo、荣耀等手机厂商的AI助手之所以跑得快，在于它们能直接控制操作系统。智能体获得更深的接口和权限，跨 App的任务便跑得更快更丝滑。

以“一句话点外卖”为例，目前主流方案仍然依赖的是视觉路线：读屏+模拟点击。这套路径的技术基底，是访问手机一向最敏感的系统级权限：无障碍服务（Accessibility Service） ”。

无障碍服务原本是服务于残障人士的辅助功能，也是系统级别的最高权限。通过它可以看到屏幕上银行卡密码、聊天记录等所有信息，继而替用户点击、长按、滑动屏幕，相当于手机里的一双“上帝之手”。

云安全联盟大中华区 Fellow、CTO，原华为终端应用安全首席架构师王安宇向我们提到，从“AI 按键”一键唤起手机助手，到调用需要系统签名的敏感权限，再到在锁屏、后台状态唤醒手机助手，也都需要系统级别支持。

如果是第三方开发的手机助手，高权限往往会被手机系统严防死守。但对于手机厂商自己的原生助手，限制相对宽松。我们的此前测评便发现，OPPO、vivo、荣耀在原生助手与第三方助手之间存在明显的“权限双标”。（详情见：万字详解智能体：AI手机走“盲道”）

这或许一部分解释了字节作为软件厂商为什么会与中兴深度合作，推动豆包向系统层迭代。毕竟谁掌握系统级位置，谁就能更快掌握下一代流量入口。

除了无障碍权限，智能体还在尝试其他操作手机的技术。豆包手机助手是通过“注入模拟的用户输入事件”（inject events）权限来完成的。业内专家告诉21记者，豆包这项权限可以跨屏、跨应用来模拟点击事件，同类权限在手机厂商原生助手中也存在。这也解释了用户在手机前端刷抖音，并不影响手机助手在后台执行任务。

豆包因此也做出了一些限制。目前只有中兴努比亚M153搭载了豆包手机助手，努比亚M153为工程机，未面向市场规模化生产，更像一个试验箱。而媒体实测中，努比亚M153的灵动岛也会提示豆包手机助手在执行长任务，且用户可以随时中断，还算不上全面放开“全自动驾驶”。

面对手机助手这块香饽饽，各家有各家的利益蛋糕。手机智能助手能不能读 App 数据？读到的数据到底归谁？

这并不是生成式 AI 时代才冒出来的矛盾。2017年8月，腾讯与华为就数据权限问题一路打到了工信部。

当时腾讯指控华为旗下手机荣耀 Magic 在“智能推荐”场景中收集微信聊天内容，用于向用户推荐餐厅、天气、购物等，侵犯了用户隐私，也侵犯了“属于腾讯和用户的数据”。

华为则回应称：所有用户数据都属于用户，不单方面属于腾讯或华为。而且公司在处理用户数据之前已经取得了用户授权。

这场冲突背后，实质上是三个关键矛盾：第一，用户授权的效力边界在哪里？是不是一次授权，处处生效？第二，除了用户，手机助手是否还需要App的同意？第三，App 与用户的协议，能不能禁止第三方对其数据进行“读屏访问”？

八年过去，AI来到类似的十字路口。当手机助手能理解乃至操作屏幕，边界更加模糊。

对外经济贸易大学法学院教授、数字经济与法律创新研究中心主任许可认为，手机智能助手既包含用户权益，也包含 App 平台的权益。

许可解释，从访问目的来看，智能体的合法性并非源于与平台的协议，而是完全依赖用户授权；其有效性取决于能否真实、准确、完整地理解用户意图，且不存在恶意行为。

但许可同时也指出，用户授权会有两大风险：首先，用户授权本身可能存在瑕疵，比如授权可能存在信息不对称、误导，或者未充分告知。同时，智能体不一定准确理解了用户意图，操作也可能偏离授权范围。也就是说，单一的用户授权并不总是足够稳健。

根据此前对各个AI手机的测评，对于敏感权限的告知与授权仍存在透明度不够等问题。（详情见：万字详解智能体：AI手机走“盲道”）

豆包在白皮书中给出的方案，是强化“可解释授权”。其提及，⽆论是⾖包手机助⼿开启时，还是启⽤其他应⽤时，都会以向⽤户阐释数据处理规则。只有在获得⽤户同意后，相关功能才会正式启⽤；⽤户对数据和功能有⾼度控制权，以 AI 操作⼿机为例，当涉及可能影响⽤户重要权益的操作时，助⼿会主动征求⽤户的确认，确保操作符合⽤户的真实意图。

北京师范大学法学院副教授吴沈括还提出了另一种解决方案：单一授权还是双重授权，具体场景具体分析。如果手机助手执行的只是用户的“纯工具性”指令，与相关 App 不构成竞争关系，那授权方式还可以有更多考虑。

在商业生态之外，影响更深远的问题是隐私。

上述提到的读屏，已是各个手机助手的共同标配，而且边界还在被不断推远。根据我们在10月对今年新机的最新实测，OPPO、vivo、荣耀手机助手能够在更多场景、更大范围内持续读取屏幕内容。

这触碰了一道最敏感的安全底线。汉华飞天信安科技有限公司总经理彭根解释，操作系统尤其是安卓操作系统设置了沙箱机制，系统为每个App分配独立运行空间，实现数据隔离，使得淘宝不能读取京东的数据，微信也无法直接看到支付宝的内容。

这套隔离系统，构成了移动互联网十年来最基本的秩序，但手机助手的读屏功能绕过了这一秩序。“这就好比原本彼此隔离的房间，现在有人可以通过窗户窥探内部。” 王安宇比喻道。

一旦这扇窗被打开，风险不再只是商业竞争。走出去智库总经理陆俊秀担心的是，手机助手借此拥有了跨平台用户画像，可以同时看到微信的聊天记录、淘宝的购物偏好、银行 App 的消费通知，并将其贯通成一个跨平台的用户画像。一旦被不当使用，从精准营销到精准诈骗，都将变得前所未有的精确。

考虑到这一点，行业标准目前也更强调“双重授权”。比如，今年12月1日，云计算标准和开源推进委员会联合中国信息通信研究院研制的《端云协同智能体交互双重授权安全指引》中，就明确智能体在访问第三方应用前，应遵循双重授权原则。先通过第三方应用的授权，并在获得用户的授权后才允许访问。

同时，智能体在代替用户执行操作时，还必须确保用户身份不被冒用、权限不被滥用。

清华大学电子工程系信息系统研究所副所长王钺也解释，智能体会逐渐摆脱“工具属性”，具备一定自主性。因此用户与它的互动不再是简单指令执行，而是一种需要建立可信预期的关系。

可信赖性意味着，智能体需要具备可识别的独立身份，区分真实用户和AI——这是将其纳入治理的基础。在这一基础上，用户与智能体之间再建立动态更新的授权协议，授权既需具备法律效力，还要能转化为可被执行的技术。在技术之外，治理规则也还有很长的路需要探索。

特别推荐

短期消费数据几何？

证券之星资讯

2025-12-03

外资发声：中国股市或大涨43%！

证券之星资讯

2025-12-03

钛白粉集体涨价！六大概念股盘点（名单）

证券之星资讯

2025-12-03

首页股票财经基金导航

举报专区联系我们

从豆包助手说起手机智能体还有哪些待解难题？

相关个股

相关阅读

特别推荐

从豆包助手说起 手机智能体还有哪些待解难题？

相关个股

相关阅读

特别推荐

从豆包助手说起手机智能体还有哪些待解难题？