/ ai资讯

豆包手机助手动了谁的蛋糕?

发布时间:2025-12-07 20:32:10

文 |镜相工作室,作者 | 彭杰克,编辑 | 谌岩

短短几天 ,在各方质疑、争论、限制下,豆包手机助手一退再退。

继下线手机助手操作微信的功能后,12月5日上午,针对刷分、刷激励,金融类app,部分游戏这三大使用场景,豆包手机助手放弃了操作权限。公告中,豆包方面的措辞显得有些无奈——“这是为了让技术走得更稳、更远的必要铺垫,希望能得到大家的理解。”但就在昨天,阿里系App也集体“拉黑”了豆包手机助手,出于风控原因,淘宝、闲鱼、大麦等App无法登陆,估计其他大厂的措施也都在路上了。

这样的遭遇,放在整个移动互联网行业的大环境下,再正常不过。

当年,移动互联网让人类第一次把时间塞进一块小小的屏幕里,社交网络、信息流、推荐算法……整套注意力经济在过去十多年长成参天大树。它要求用户点击、滑动、停留,让每一秒都被平台捕获、计算、转化,最终变成各家大厂的商业价值。如今,字节拿出AI手机助手,本来只是一次试水,却被认为想掀桌子,改写已有的规则,重塑早就划分完毕的地盘格局,这是各家都无法容忍的。

于是,隐私保护和风控成了最合适的缘由,让人无法反驳,字节也只能退让。但是,这样的尝试不应该被否定,总有人要有胆量去撼动固化的利益格局,这是科技进步和范式转移的开端,生态从注意力为中心转向以需求和意图为中心,也是大势所趋。

这种可预见的变化会自然冲击原有的信息孤岛和商业逻辑,让手机不再是承载应用、广告的容器,而是成为一个随时替用户行动的代理、Agent。入口、路径、停留都会重新分配。只不过这个过程会异常艰难,字节至少有敢为人先的勇气,也有快人一步的野心,这次尝试即便不成功,带来的思考和影响也会是巨大的。

理想和现实存在差距

豆包手机助手的发布在字节跳动今年的计划内。据晚点Latepost报道,这是一项从去年上半年就开始筹备的任务,字节负责大模型功能、部分操作系统相关的工作,硬件的设计、生产等主要由中兴作为ODM(Original design manufacturer,原始设计制造商)负责。

12月的第一天,豆包手机助手发布技术预览版,工程样机nubia M153同步少量发售,官网售价3499元,很快售罄,二手平台普遍加价超千元。

从官方演示视频来看,这款AI手机确实吊足了胃口:它可以根据一篇小红书种草笔记,识别出相应产品,帮用户跨平台比价并选择最低价链接下单;能够一一完成浏览并整理旅游攻略、在地图App上标记用户收藏的餐厅、根据出行计划预定旅游目的地展览等多项复杂任务;如果你足够相信AI,授权它记忆屏幕内容,它将越来越了解你,在你需要的时候提醒你朋友推荐过什么餐厅,自动帮你下单孩子会喜欢的生日礼物……

这一切把动手操作降到最低,将手机从被动工具变成主动帮手。然而,发布次日,抢到样机的用户陆续发布反馈,豆包提醒的“大模型技术不可控”并没有成为焦点,反而是App之间的“墙”影响了使用体验。

先是有多位nubia M153用户反映,其微信异常退出甚至无法登录,并被提示“微信登录环境存在异常”。对此,腾讯相关人士回应上海证券报称:“我们没有什么特别的动作,这个不是二选一,不知道是不是中了安全风控措施。”

然后是银行、支付类App使用受限,如有用户用豆包手机助手网购,流程进行到人工输入付款密码时,被支付宝判定支付环境存在安全风险、中途截停了任务。还有用户让豆包手机助手代打了一把王者荣耀,游戏结束后,该用户被判定使用外挂、被系统禁赛10分钟。

豆包手机助手的技术原理是通过视觉识别用户手机屏幕上的按钮、文字等内容,把信息交给AI去推理,再输出指令模拟人手去点击屏幕。这个技术并不新鲜,原理有点类似于早年的“按键精灵”或“自动抢红包”,只不过识别的内容和返回的操作都更复杂。

主要问题是,这样的操作需要获得很高的权限,才能识别出用户屏幕上的内容。因此,许多App以保护用户隐私和防止误操作等为由,主动封禁。甚至有声音指控豆包手机助手未经授权获取操作系统高危权限、侵犯用户隐私等。

但实际上,字节不可能给自己埋下这样的隐患。面对质疑,他们做了两件事情:一是将微信、金融、游戏等个人隐私更敏感,安全要求更高的App主动下线功能,AI无法识别操作;二是建立了透明、合规且完善的权限管理体系,保证用户事前充分知情,事中随时介入,事后数据清理的权利。

比如,豆包手机助手在帮用户完成任务时,需要调用手机系统级权限,这需要用户主动授权,这不是豆包率先这样做,目前市场上的AI助手很多都会调用,才能提供自动操作手机的服务;像自动驾驶一样,豆包调用权限操作手机时屏幕上也会明确提示,用户随时可以中断;而在执行一些敏感任务时,比如敏感权限授权弹窗、支付环节、身份验证等,都会暂停操作,让用户二次确认后自己完成;整个过程中,豆包手机助手不会在云端存储任何屏幕内容,后续也不会用相关数据进行模型训练,必须把数据上传到云端处理时,传输和处理过程均采取严格的保护措施保障⽤户数据安全,数据使⽤完后会⽴即删除。

隐私安全是普通用户最关心的事情,也是国家法律严格规定的红线。事实上,移动互联网时代的算法推荐,不管是刷短视频、逛购物网站、阅读文章,还是各大App的开屏广告、信息流广告,都会使用用户的行为数据,也会用到很多的高敏感权限,很多人甚至觉得手机在“监听”自己,说了什么话、打了什么字、逛了什么网站都被追踪了。但绝大多数时候,这些都是获得用户授权的,正规公司的产品会受到手机厂商和相关部门严格的监管。

只不过“AI一边替你操作手机,一边疯狂获取你的隐私信息”的场景太过具象,激发出人们对隐私泄露的恐惧,有极好的传播效果。因此,这也成了各大潜在对手,包括手机厂商、应用厂商抵制豆包手机助手最好的理由。

与手机、应用厂商的双重矛盾

可以说,字节这次发AI手机助手,把市场上的人们得罪了个遍。

早在豆包手机助手发布之前,过去一整年,几乎所有的手机厂商都在加班加点地研发自家的AI助手,一些大模型公司也想当AI Agent方案供应商,让自家的Agent入驻用户手机。但是,没有哪家像字节这样令所有人紧张。

如果是华米OV来做,威胁有限,因为彼此都无法把自家助手装到友商手机里;如果是大模型公司做,更是毫无话语权,人家凭什么要用你的Agent;如果是应用大厂来做,比如那些坐拥国民App的大厂,腾讯、阿里、字节,虽然手机厂商不敢不认真对待,但微信不可能让豆包操作,支付宝也不可能让元宝操作,美团也不可能让千问操作,手机助手功能将十分有限。

但字节偏偏要试一试,还找来了中兴。很明显,虽然说是合作,但字节是主导,更像是中兴给字节代工。这样一来,字节又有硬件,又有技术和用户规模都在前列的豆包,先发优势巨大,这让手机大厂和应用大厂同时坐不住了。

对于手机厂商来说,虽然大模型技术不一定强,但和大模型创企合作是各取所需,关系可控。而在应用大厂看来,AI手机还处于“PPT阶段”,体验差,效率低,构不成太大威胁。但如果是字节联合中兴来做,就不一样了,手机大厂会担心中兴会不会成为手机界的赛力斯,在字节的加持下一飞冲天,应用大厂则会担心字节把技术和模式跑通后,骑到自己头上,变成用户流量总龙头。

因此,字节的入局在战略逻辑上本身就面临双重挑战:挑战既有手机厂商对“AI手机 系统级入口”的封闭控制,也挑战主流应用厂商对“流量、用户使用时长、广告变现”的路径依赖。

手机厂商中,荣耀的危机感显而易见。

先是荣耀首席影像工程师罗巍直言:“我不看好。因为字(节)没有硬件研发能力,或者硬件能力并不比中兴领先。那么就是两个矮子在一起,也不会生个高子。我预计如果坚持的话,三世而亡。否则一代死。”

然后是荣耀终端股份有限公司产品线总裁方飞,其称豆包手机助手的演示视频让人眼熟,“基于UI Agent实现对通用场景的支持并自动执行,这与荣耀AI从特定任务向通用化执行的发展道路是一致的。”

如果说字节与手机厂商的竞争,还是新趋势下的你追我赶,那么其与主流应用厂商间的冲突,则触及了移动互联网生态中最敏感、最根源的矛盾,是对AI时代下,谁控制入口、谁定义操作、谁分配流量、谁决定变现规则的争夺。

当背靠全球最大独角兽的豆包手机助手,获取系统级高敏感权限,试图跨应用自动化,在用户的一句指令下完成浏览、提取、对比、交易等任务时,它实质上绕过了传统App的界面与交互结构,让用户不必打开App,不必浏览、点击、停留,这对依赖注意力经济的应用厂商而言是最直接的冲击。

这意味着,开屏广告不再被用户看到,提升用户使用时长的小巧思可以被跳过,乃至平台与平台间的主视觉设计、差异化定位都将被消解。大众最常用的App,从流量控制、用户行为到推荐逻辑、商业模式,都可能被AIOS撼动。更不用说字节和其他大厂业务竞争广泛,电商、短视频、本地生活、社交、AI、游戏等全方位布局,腾讯、阿里、京东、美团、拼多多、携程、快手、百度,没有一家会放心豆包操作自家的App。

如果说华米OV们来做AI手机,应用厂商们还只是出于对范式转移的担忧而采取限制或保持沉默,但如果是字节来做,大厂们就会集体抵制了。这是一种本能的应激反应。

撞墙和拆墙的路

字节是激进的。突然搞出一个AI手机助手,无疑是在和手机大厂和应用大厂同时宣战。但字节也是勇敢的,在利益固化严重,甚至字节自己就是旧范式的最大受益者之一时,主动走出舒适区,探索新的可能性,这种创新精神是值得鼓励的。

整个行业过去十几年始终围绕“注意力—流量—广告”的逻辑构建生态,用户的操作越复杂、停留越久,平台越受益。AI手机的出现从逻辑底层提出了新的方向:如果未来的终端更像个人助理,而不是内容入口,那么用户停留时间、页面点击、跳转深度,这些曾经主宰互联网的指标都将被重塑。

实际上,豆包手机助手和过往那些手机厂商的AI助手类似,依旧停留在非常早期的阶段。无论是字节,还是荣耀、智谱,都在采用一种过渡性的GUI(Graphical User Interface)方案,通过“读屏 模拟操作”来调用App。和更理想的意图框架相比,它的最大优势是能绕过App后台授权、从前台直接操作,但难点在于适应界面变化,如果App突然更新设计、按钮位置变了,AI又得重新学习。这些产品都有着成功率低、响应不稳定、耗时长等共性问题,可能用起来还没有人亲自操作更高效,但万事开头难,走出这一步,后面才有机会变得更好。

但第一步就注定会撞到高墙——权限、利益、安全、生态秩序。这些问题无论谁先做,都会发生,字节做,更是会撞得头破血流。

这也是为什么必须有人先来触碰这些壁垒。壁垒越厚,创新者越痛,但如果没有这一撞,用户永远不知道手机能不能变得更聪明,也无法判断真正的“手机智能化”到底应不应该由消费者来决定,而不是由平台利益来决定。

字节选择在此刻站出来,冒着隐私保护、舆论倾向、体验糟糕等风险,把大模型置于真实的手机使用场景里,是一次非常有意义的尝试。

从第一代工程样机三万台的备货量来看,这本身就是一次工程测试,而不是全面商业化的发布。字节或许并不想与其他手机厂商拼体量,而是用最小规模、最可控的方式验证一件事:当用户能够选择更高效的决策方式时,原有的互联网生态是否还能保持曾经的稳定?从用户的热情、样机加价,再到主流应用纷纷触发风控,这台小小的工程样机其实已经给出了答案。

目前,豆包手机助手还远远称不上成熟,它的能力受限于GUI的先天缺陷,也会继续面对权限、系统兼容、风险控制等层层挑战。但在这个初期阶段,它至少证明了一件事:AI手机不是概念机,而是能够通过真实用户场景带来效率提升的东西。

从这个角度看,字节撞上的每一道墙,其实都属于行业必须面对、必须拆解的墙。继续往前走,需要更强的模型、更稳的系统、更严密的隐私边界,也需要建立新的商业分配机制。

最重要的,是需要有对敢为人先的包容。

参考资料

晚点Latepost:《晚点独家丨“豆包手机” 酝酿中,字节为大模型寻硬件载体》

21世纪经济报道:《万字详解智能体:AI手机走“盲道”》

电厂:《“豆包手机”初战遇阻,AI打不破互联网生态壁垒》

中国企业家杂志:《豆包手机刚上线,就被微信淘宝“拉黑”了》

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com