来源:21世纪经济报道
媒体
2025-12-03 16:56:59
(原标题:从豆包助手说起 手机智能体还有哪些待解难题?)
21世纪经济报道记者 王俊
12月,行业最重磅的一条消息是字节跳动要和中兴造手机。但很快,字节出面解释,没有开发手机的计划,目前只是在与多家手机厂商洽谈AI助手合作。
这轮合作的核心是豆包手机助手。在媒体实测中,手机AI助手已经不再是一个跑在前台的 App,而更像能接管整部手机的“数字影子”:跨平台比价点外卖、搜小红书做攻略、自动回微信,甚至能替用户打游戏。
这些能力的共同技术前提是,AI拿到了系统级别的手机权限。 业内专家告诉21记者,为豆包助手配备独立的物理按键、语音唤醒、识屏能力和跨第三方App调用等能力,都需要操作系统级别的支撑,这是普通App无法企及的等级。也印证了字节公开所说的合作发生在系统层面,而非简单的应用层。
但智能体越往手机系统深水区走,数据问题越难回避。“通过屏幕能读聊天记录,个人隐私怎么办?”“隐私问题很难解决,权限要的太大了”,类似评论在豆包手机助手的留言区多次出现。
字节显然也意识到了这一点。《豆包手机助手隐私安全白皮书》开篇便写道,⽤户的数据与隐私安全性始终是⾸要考虑因素之⼀。12 页的详细篇幅,足以说明手机智能体的敏感程度。
这不仅是豆包,而是所有手机助手都面临的问题。接下来值得观察的,除了手机助手们的性能和市场渗透率,还有AI 时代的“系统级权限”该如何以合规方式落地。
从去年开始,手机助手(智能体)一句话点外卖、订餐厅等功能业已上线,是OPPO、vivo、荣耀等手机厂商主打的宣传卖点,但当时噱头远远大于性能,许多操作还有失败、延迟、误触问题。
到了今年10月底,在OPPO、vivo、荣耀更新的最新系统中,智能体已经进一步升级,长记忆、比价、抢票等能力纷纷上阵。
行业的判断越来越清晰:手机智能体可以直接与用户交互,提供新的服务形态,是新的流量入口。对岸的马斯克最近甚至断言,“未来App将彻底消失,所有交互由AI实时生成、预测与完成。”
国内的数据已经能看到这一趋势。Quest Mobile报告显示,自2024年9月起,六大手机厂商的AI助手规模一年内合计增长0.65亿,同比增长13.9%;到了今年9月,手机厂商AI助手总用户规模已经突破5.35亿。
OPPO、vivo、荣耀等手机厂商的AI助手之所以跑得快,在于它们能直接控制操作系统。智能体获得更深的接口和权限,跨 App的任务便跑得更快更丝滑。
以“一句话点外卖”为例,目前主流方案仍然依赖的是视觉路线:读屏+模拟点击。这套路径的技术基底,是访问手机一向最敏感的系统级权限:无障碍服务(Accessibility Service) ”。
无障碍服务原本是服务于残障人士的辅助功能,也是系统级别的最高权限。通过它可以看到屏幕上银行卡密码、聊天记录等所有信息,继而替用户点击、长按、滑动屏幕,相当于手机里的一双“上帝之手”。
云安全联盟大中华区 Fellow、CTO,原华为终端应用安全首席架构师王安宇向我们提到,从“AI 按键”一键唤起手机助手,到调用需要系统签名的敏感权限,再到在锁屏、后台状态唤醒手机助手,也都需要系统级别支持。
如果是第三方开发的手机助手,高权限往往会被手机系统严防死守。但对于手机厂商自己的原生助手,限制相对宽松。我们的此前测评便发现,OPPO、vivo、荣耀在原生助手与第三方助手之间存在明显的“权限双标”。(详情见:万字详解智能体:AI手机走“盲道”)
这或许一部分解释了字节作为软件厂商为什么会与中兴深度合作,推动豆包向系统层迭代。毕竟谁掌握系统级位置,谁就能更快掌握下一代流量入口。
除了无障碍权限,智能体还在尝试其他操作手机的技术。豆包手机助手是通过“注入模拟的用户输入事件”(inject events)权限来完成的。业内专家告诉21记者,豆包这项权限可以跨屏、跨应用来模拟点击事件,同类权限在手机厂商原生助手中也存在。这也解释了用户在手机前端刷抖音,并不影响手机助手在后台执行任务。
豆包因此也做出了一些限制。目前只有中兴努比亚M153搭载了豆包手机助手,努比亚M153为工程机,未面向市场规模化生产,更像一个试验箱。而媒体实测中,努比亚M153的灵动岛也会提示豆包手机助手在执行长任务,且用户可以随时中断,还算不上全面放开“全自动驾驶”。
面对手机助手这块香饽饽,各家有各家的利益蛋糕。手机智能助手能不能读 App 数据?读到的数据到底归谁?
这并不是生成式 AI 时代才冒出来的矛盾。2017年8月,腾讯与华为就数据权限问题一路打到了工信部。
当时腾讯指控华为旗下手机荣耀 Magic 在“智能推荐”场景中收集微信聊天内容,用于向用户推荐餐厅、天气、购物等,侵犯了用户隐私,也侵犯了“属于腾讯和用户的数据”。
华为则回应称:所有用户数据都属于用户,不单方面属于腾讯或华为。而且公司在处理用户数据之前已经取得了用户授权。
这场冲突背后,实质上是三个关键矛盾:第一,用户授权的效力边界在哪里?是不是一次授权,处处生效?第二,除了用户,手机助手是否还需要App的同意?第三,App 与用户的协议,能不能禁止第三方对其数据进行“读屏访问”?
八年过去,AI来到类似的十字路口。当手机助手能理解乃至操作屏幕,边界更加模糊。
对外经济贸易大学法学院教授、数字经济与法律创新研究中心主任许可认为,手机智能助手既包含用户权益,也包含 App 平台的权益。
许可解释,从访问目的来看,智能体的合法性并非源于与平台的协议,而是完全依赖用户授权;其有效性取决于能否真实、准确、完整地理解用户意图,且不存在恶意行为。
但许可同时也指出,用户授权会有两大风险:首先,用户授权本身可能存在瑕疵,比如授权可能存在信息不对称、误导,或者未充分告知。同时,智能体不一定准确理解了用户意图,操作也可能偏离授权范围。也就是说,单一的用户授权并不总是足够稳健。
根据此前对各个AI手机的测评,对于敏感权限的告知与授权仍存在透明度不够等问题。(详情见:万字详解智能体:AI手机走“盲道”)
豆包在白皮书中给出的方案,是强化“可解释授权”。其提及,⽆论是⾖包手机助⼿开启时,还是启⽤其他应⽤时,都会以向⽤户阐释数据处理规则。只有在获得⽤户同意后,相关功能才会正式启⽤;⽤户对数据和功能有⾼度控制权,以 AI 操作⼿机为例,当涉及可能影响⽤户重要权益的操作时,助⼿会主动征求⽤户的确认,确保操作符合⽤户的真实意图。
北京师范大学法学院副教授吴沈括还提出了另一种解决方案:单一授权还是双重授权,具体场景具体分析。如果手机助手执行的只是用户的“纯工具性”指令,与相关 App 不构成竞争关系,那授权方式还可以有更多考虑。
在商业生态之外,影响更深远的问题是隐私。
上述提到的读屏,已是各个手机助手的共同标配,而且边界还在被不断推远。根据我们在10月对今年新机的最新实测,OPPO、vivo、荣耀手机助手能够在更多场景、更大范围内持续读取屏幕内容。
这触碰了一道最敏感的安全底线。汉华飞天信安科技有限公司总经理彭根解释,操作系统尤其是安卓操作系统设置了沙箱机制,系统为每个App分配独立运行空间,实现数据隔离,使得淘宝不能读取京东的数据,微信也无法直接看到支付宝的内容。
这套隔离系统,构成了移动互联网十年来最基本的秩序,但手机助手的读屏功能绕过了这一秩序。“这就好比原本彼此隔离的房间,现在有人可以通过窗户窥探内部。” 王安宇比喻道。
一旦这扇窗被打开,风险不再只是商业竞争。走出去智库总经理陆俊秀担心的是,手机助手借此拥有了跨平台用户画像,可以同时看到微信的聊天记录、淘宝的购物偏好、银行 App 的消费通知,并将其贯通成一个跨平台的用户画像。一旦被不当使用,从精准营销到精准诈骗,都将变得前所未有的精确。
考虑到这一点,行业标准目前也更强调“双重授权”。比如,今年12月1日,云计算标准和开源推进委员会联合中国信息通信研究院研制的《端云协同 智能体交互双重授权安全指引》中,就明确智能体在访问第三方应用前,应遵循双重授权原则。先通过第三方应用的授权,并在获得用户的授权后才允许访问。
同时,智能体在代替用户执行操作时,还必须确保用户身份不被冒用、权限不被滥用。
清华大学电子工程系信息系统研究所副所长王钺也解释,智能体会逐渐摆脱“工具属性”,具备一定自主性。因此用户与它的互动不再是简单指令执行,而是一种需要建立可信预期的关系。
可信赖性意味着,智能体需要具备可识别的独立身份,区分真实用户和AI——这是将其纳入治理的基础。在这一基础上,用户与智能体之间再建立动态更新的授权协议,授权既需具备法律效力,还要能转化为可被执行的技术。在技术之外,治理规则也还有很长的路需要探索。
21世纪经济报道
2025-12-03
21世纪经济报道
2025-12-03
21世纪经济报道
2025-12-03
21世纪经济报道
2025-12-03
21世纪经济报道
2025-12-03
21世纪经济报道
2025-12-03
证券之星资讯
2025-12-03
证券之星资讯
2025-12-03
证券之星资讯
2025-12-03