来源:21世纪经济报道
媒体
2025-08-22 17:34:57
(原标题:AI替我多付了7.9元:智谱智能体带来的新问题)
21世纪经济报道记者 王俊 实习记者 蔡欣佁
在点一份外卖的过程中,AI智能体在毫秒间额外加购了一张“神抢手”券,使得这笔订单多了7.9元。手动付完款后,用户突然在订单中看到一张奶茶的抵扣券,这时才意识到,原来是AutoGLM2.0的“顺手”操作。
这是在8月20日,智谱推出最新智能体AutoGLM2.0后,21世纪经济报道记者的首次实测体验。
在业内广泛提及的智能体元年,智谱交出了一份亮眼的成绩单。不少自媒体实测之后感慨,电影中的管家“贾维斯”真的来了。AI不仅能聊天,还能完成现实任务,帮忙点外卖、买机票、对比价格,便捷的未来似乎正在快速逼近。
但在这些理念攻占用户心智之前,更直接的人机信任问题必须要解决。尤其是智能体可能在未经同意的情况下做出决定时,AI代劳和越界的界线应该划在哪里?
智谱对此回应21世纪经济报道记者:模型目前能力还在持续优化迭代,已经将此问题反馈到算法,针对额外添加商品券识别的准确性,会持续提升性能。并且,AutoGLM2.0通过工程策略和权限边界来防止“超指令”行为,支付、发布等高风险步骤默认不自动执行。
在全球范围内,智能体已成为2025年的核心战场。除了海外激烈布局的苹果、Anthropic、谷歌、OpenAI,国内的百度、字节、腾讯、阿里也已全面投入。
智谱的身份颇为特殊。作为大模型公司,其既没有自己的硬件设备,也没有互联网时代积攒足够流量的APP,但在智能体版图中是重要角色之一。
回看从2023年开始的发展,智谱智能体的落地路线有两条:其一是与硬件厂商合作,将智能体内嵌到手机系统中。去年9月,智谱与荣耀在智任务智能体、UI理解和交互执行、多模态理解和生成大模型等方向达成长期合作;10月,智谱与三星官宣合作。Agentic GLM已全面接入三星Galaxy S25系列,搜索功能会直接调用智谱清言智能体。
其二是推进自己独立的智能体。去年10月,智谱也同步推出了AutoGLM1.0,并进行了内测。但初代AutoGLM调用APP的功能还很有限,那时的AutoGLM1.0完全占据了用户手机,AI代劳并不比自己操作省时省力,数据保护和权限问题更是老大难。
手机承载着更多日常场景,更容易占领用户心智,但做手机智能体并非智能体。因为智能体需要在跨APP调用、自动化执行上突破,这既是技术挑战,也是商业挑战。目前包括Manus在内的绝大多数智能体,只有电脑网页版本。
一度,不少手机厂商尝试通过GUI(图形界面)读取屏幕、模拟人类操作来完成指令执行。但这种方式依赖于开启手机的“无障碍服务”——其拥有系统级别的最高权限,可以直接看到屏幕上银行卡密码、聊天记录等所有信息,继而替用户点击、滑动屏幕、输入文本,有不小隐私风险。
此前21世纪经济报道实测发现,几乎所有手机智能体都调用了无障碍服务权限(详情:万字详解智能体:AI手机走“盲道”)。专业人士认为,这会带来隐私风险和网络安全隐患,成为黑客的攻击目标。随着这一风险的暴露,迫于监管压力,许多厂商谨慎考量这条路线。
于是智谱选择了另一条聪明的路线:造一台云手机。
在AutoGLM2.0中,用户能看到一个独立的“虚拟手机”界面,所有操作都在云端完成。
尚隐科技公司CEO张仁卓作了个比喻:人们日常使用的手机就像家里买了一台电视机,所有东西(屏幕、遥控器、芯片)都在家里,坏了丢了就要重买。而云手机更像把电视放在云端机房,家里只要一个小小的屏幕显示器,就能照样使用。换句话说,手机端只是个“手柄”,真正的运作都在云端。
云手机带来两方面的好处:一来解决了屏幕占用的问题。用户只要交代任务,智能体在云端执行的同时,用户仍能正常操作本机。二来,解决了手机厂商无解的无障碍权限调用的问题。智谱向21世纪经济报道确切表示,所有的操作执行都搬到了云端设备上,所以并不再依赖本机的无障碍权限。
但新路线依旧需要读屏。在初始操作时,AutoGLM2.0会提醒读取屏幕提示:系统会截取当前云设备的屏幕内容,将图像发送给大模型进行分析理解。
AutoGLM技术负责人刘潇在接受《晚点》采访时回应了这个担忧:在“云手机”登录时,如同配置一部新手机,登录和注册并不会记住用户账号和密码,而是通过和云厂商合作记录了登录状态;读屏的信息在入库前会做清洗和脱敏。此外,对于微信这种更敏感的场景,智谱选择舍弃。
在呈现的服务使用须知当中,21记者留意到,苹果手机提示索取无障碍权限,安卓手机却并未出现“无障碍权限”相关字眼。对此,智谱解释称,属于文本问题,今天(8月22日)提交应用商店的版本会修复这一问题。
相较此前智能体实测,更新后的智谱AutoGLMglm2.0确实让人眼前一亮。前述实测中,21世纪经济报道记者发现,很多智能体多轮操作的性能仍不稳定。而智谱AutoGLM2.0,能复现推理能力并完成多轮任务,调用App也较为丝滑。
发出“帮我在美团点一份鲍师傅”的指令后,AutoGLM打开云手机,接管云手机屏幕。智能体的操作和人类几乎完全一样,点开美团、搜索餐点,甚至帮忙关闭了广告。
在最重要也最敏感的结账环节,AutoGLM2.0会将设备的接管权限交还到用户手上。智谱称,“涉及支付、内容发布、敏感操作时,系统会强制请求您确认,或由您直接‘接管手机’完成。
比如在点外卖的场景下,到了“确认交易”并支付的页面,智能体就显示“任务结束”,接下来的支付行为需要用户自行接管手机之后完成。与此同时,可以看到屏幕上方持续滚动播放一行小字:AutoGLM不会保存获取应用账号密码,在用户接管以及非任务执行状态下不会读取屏幕信息。
这看似周全,但信任问题并未因此消除。
在我们的点餐测试中,AutoGLM2.0在订单确认页面“自作主张”地加购了一张“神抢手”优惠券,最终导致账单多出7.9元。
这种“为你好”的操作,发生在记者未意识到的情况下,分秒之间加购优惠券,然后跳转支付。虽然支付动作仍由用户完成,但基于此前丝滑的操作和没有单独提示,这一额外花费并未引起注意。
(AutoGLM2.0自动“顺手”买券)
智谱对此表示,模型目前能力还在持续优化迭代,已经将此问题反馈到算法,对于额外添加商品券识别的准确性会持续提升性能。并且,AutoGLM2.0通过工程策略和权限边界来防止“超指令”行为,支付、发布等高风险步骤默认不自动执行。
当AI以“为你好”为理由,替用户做出未经同意的选择时,代劳与越界的界限在哪里?这不仅仅是智谱的课题,也是智能体行业必须回答的问题。
在业界设想的美好未来中,智能体作为私人管家,可以帮你应付多种琐碎、高频任务:在外卖战中一家家比价,通过反复计算挑出一张最便宜的机票组合。在这些与价格比对、算法推荐直接相关的场景中,智能体的价值最容易显现,但也最容易触碰敏感边界。
刘潇在前述采访中提到,更有想象力的未来可能是,智能体拥有一套单独的支付基础设施。例如,给智能体开设独立钱包,规定其能自由发挥的金额和商品类型;提供“撤销”与“追溯”的保障机制,让智能体的退款能迅速被处理,从而给AI代劳更自由、更可控的边界。
但这一切都需要建立在人机信任的基础之上。
21世纪经济报道
2025-08-22
21世纪经济报道
2025-08-22
智通财经
2025-08-22
21世纪经济报道
2025-08-22
财闻
2025-08-22
21世纪经济报道
2025-08-22
证券之星资讯
2025-08-22
证券之星资讯
2025-08-22
证券之星资讯
2025-08-22