豆包手机助手动了谁的蛋糕？

发布时间：2025-12-07 20:32:10

文 |镜相工作室，作者 | 彭杰克，编辑 | 谌岩

短短几天，在各方质疑、争论、限制下，豆包手机助手一退再退。

继下线手机助手操作微信的功能后，12月5日上午，针对刷分、刷激励，金融类 app，部分游戏这三大使用场景，豆包手机助手放弃了操作权限。公告中，豆包方面的措辞显得有些无奈——“这是为了让技术走得更稳、更远的必要铺垫，希望能得到大家的理解。”但就在昨天，阿里系App也集体“拉黑”了豆包手机助手，出于风控原因，淘宝、闲鱼、大麦等App无法登陆，估计其他大厂的措施也都在路上了。

这样的遭遇，放在整个移动互联网行业的大环境下，再正常不过。

当年，移动互联网让人类第一次把时间塞进一块小小的屏幕里，社交网络、信息流、推荐算法……整套注意力经济在过去十多年长成参天大树。它要求用户点击、滑动、停留，让每一秒都被平台捕获、计算、转化，最终变成各家大厂的商业价值。如今，字节拿出AI手机助手，本来只是一次试水，却被认为想掀桌子，改写已有的规则，重塑早就划分完毕的地盘格局，这是各家都无法容忍的。

于是，隐私保护和风控成了最合适的缘由，让人无法反驳，字节也只能退让。但是，这样的尝试不应该被否定，总有人要有胆量去撼动固化的利益格局，这是科技进步和范式转移的开端，生态从注意力为中心转向以需求和意图为中心，也是大势所趋。

这种可预见的变化会自然冲击原有的信息孤岛和商业逻辑，让手机不再是承载应用、广告的容器，而是成为一个随时替用户行动的代理、Agent。入口、路径、停留都会重新分配。只不过这个过程会异常艰难，字节至少有敢为人先的勇气，也有快人一步的野心，这次尝试即便不成功，带来的思考和影响也会是巨大的。

理想和现实存在差距

豆包手机助手的发布在字节跳动今年的计划内。据晚点Latepost报道，这是一项从去年上半年就开始筹备的任务，字节负责大模型功能、部分操作系统相关的工作，硬件的设计、生产等主要由中兴作为ODM（Original design manufacturer，原始设计制造商）负责。

12月的第一天，豆包手机助手发布技术预览版，工程样机nubia M153同步少量发售，官网售价3499元，很快售罄，二手平台普遍加价超千元。

从官方演示视频来看，这款AI手机确实吊足了胃口：它可以根据一篇小红书种草笔记，识别出相应产品，帮用户跨平台比价并选择最低价链接下单；能够一一完成浏览并整理旅游攻略、在地图App上标记用户收藏的餐厅、根据出行计划预定旅游目的地展览等多项复杂任务；如果你足够相信AI，授权它记忆屏幕内容，它将越来越了解你，在你需要的时候提醒你朋友推荐过什么餐厅，自动帮你下单孩子会喜欢的生日礼物……

这一切把动手操作降到最低，将手机从被动工具变成主动帮手。然而，发布次日，抢到样机的用户陆续发布反馈，豆包提醒的“大模型技术不可控”并没有成为焦点，反而是App之间的“墙”影响了使用体验。

先是有多位nubia M153用户反映，其微信异常退出甚至无法登录，并被提示“微信登录环境存在异常”。对此，腾讯相关人士回应上海证券报称：“我们没有什么特别的动作，这个不是二选一，不知道是不是中了安全风控措施。”

然后是银行、支付类App使用受限，如有用户用豆包手机助手网购，流程进行到人工输入付款密码时，被支付宝判定支付环境存在安全风险、中途截停了任务。还有用户让豆包手机助手代打了一把王者荣耀，游戏结束后，该用户被判定使用外挂、被系统禁赛10分钟。

豆包手机助手的技术原理是通过视觉识别用户手机屏幕上的按钮、文字等内容，把信息交给AI去推理，再输出指令模拟人手去点击屏幕。这个技术并不新鲜，原理有点类似于早年的“按键精灵”或“自动抢红包”，只不过识别的内容和返回的操作都更复杂。

主要问题是，这样的操作需要获得很高的权限，才能识别出用户屏幕上的内容。因此，许多App以保护用户隐私和防止误操作等为由，主动封禁。甚至有声音指控豆包手机助手未经授权获取操作系统高危权限、侵犯用户隐私等。

但实际上，字节不可能给自己埋下这样的隐患。面对质疑，他们做了两件事情：一是将微信、金融、游戏等个人隐私更敏感，安全要求更高的App主动下线功能，AI无法识别操作；二是建立了透明、合规且完善的权限管理体系，保证用户事前充分知情，事中随时介入，事后数据清理的权利。

比如，豆包手机助手在帮用户完成任务时，需要调用手机系统级权限，这需要用户主动授权，这不是豆包率先这样做，目前市场上的AI助手很多都会调用，才能提供自动操作手机的服务；像自动驾驶一样，豆包调用权限操作手机时屏幕上也会明确提示，用户随时可以中断；而在执行一些敏感任务时，比如敏感权限授权弹窗、支付环节、身份验证等，都会暂停操作，让用户二次确认后自己完成；整个过程中，豆包手机助手不会在云端存储任何屏幕内容，后续也不会用相关数据进行模型训练，必须把数据上传到云端处理时，传输和处理过程均采取严格的保护措施保障⽤户数据安全，数据使⽤完后会⽴即删除。

隐私安全是普通用户最关心的事情，也是国家法律严格规定的红线。事实上，移动互联网时代的算法推荐，不管是刷短视频、逛购物网站、阅读文章，还是各大App的开屏广告、信息流广告，都会使用用户的行为数据，也会用到很多的高敏感权限，很多人甚至觉得手机在“监听”自己，说了什么话、打了什么字、逛了什么网站都被追踪了。但绝大多数时候，这些都是获得用户授权的，正规公司的产品会受到手机厂商和相关部门严格的监管。

只不过“AI一边替你操作手机，一边疯狂获取你的隐私信息”的场景太过具象，激发出人们对隐私泄露的恐惧，有极好的传播效果。因此，这也成了各大潜在对手，包括手机厂商、应用厂商抵制豆包手机助手最好的理由。

与手机、应用厂商的双重矛盾

可以说，字节这次发AI手机助手，把市场上的人们得罪了个遍。

早在豆包手机助手发布之前，过去一整年，几乎所有的手机厂商都在加班加点地研发自家的AI助手，一些大模型公司也想当AI Agent方案供应商，让自家的Agent入驻用户手机。但是，没有哪家像字节这样令所有人紧张。

如果是华米OV来做，威胁有限，因为彼此都无法把自家助手装到友商手机里；如果是大模型公司做，更是毫无话语权，人家凭什么要用你的Agent；如果是应用大厂来做，比如那些坐拥国民App的大厂，腾讯、阿里、字节，虽然手机厂商不敢不认真对待，但微信不可能让豆包操作，支付宝也不可能让元宝操作，美团也不可能让千问操作，手机助手功能将十分有限。

但字节偏偏要试一试，还找来了中兴。很明显，虽然说是合作，但字节是主导，更像是中兴给字节代工。这样一来，字节又有硬件，又有技术和用户规模都在前列的豆包，先发优势巨大，这让手机大厂和应用大厂同时坐不住了。

对于手机厂商来说，虽然大模型技术不一定强，但和大模型创企合作是各取所需，关系可控。而在应用大厂看来，AI手机还处于“PPT阶段”，体验差，效率低，构不成太大威胁。但如果是字节联合中兴来做，就不一样了，手机大厂会担心中兴会不会成为手机界的赛力斯，在字节的加持下一飞冲天，应用大厂则会担心字节把技术和模式跑通后，骑到自己头上，变成用户流量总龙头。

因此，字节的入局在战略逻辑上本身就面临双重挑战：挑战既有手机厂商对“AI手机系统级入口”的封闭控制，也挑战主流应用厂商对“流量、用户使用时长、广告变现”的路径依赖。

手机厂商中，荣耀的危机感显而易见。

先是荣耀首席影像工程师罗巍直言：“我不看好。因为字（节）没有硬件研发能力，或者硬件能力并不比中兴领先。那么就是两个矮子在一起，也不会生个高子。我预计如果坚持的话，三世而亡。否则一代死。”

然后是荣耀终端股份有限公司产品线总裁方飞，其称豆包手机助手的演示视频让人眼熟，“基于UI Agent实现对通用场景的支持并自动执行，这与荣耀AI从特定任务向通用化执行的发展道路是一致的。”

如果说字节与手机厂商的竞争，还是新趋势下的你追我赶，那么其与主流应用厂商间的冲突，则触及了移动互联网生态中最敏感、最根源的矛盾，是对AI时代下，谁控制入口、谁定义操作、谁分配流量、谁决定变现规则的争夺。

当背靠全球最大独角兽的豆包手机助手，获取系统级高敏感权限，试图跨应用自动化，在用户的一句指令下完成浏览、提取、对比、交易等任务时，它实质上绕过了传统App的界面与交互结构，让用户不必打开App，不必浏览、点击、停留，这对依赖注意力经济的应用厂商而言是最直接的冲击。

这意味着，开屏广告不再被用户看到，提升用户使用时长的小巧思可以被跳过，乃至平台与平台间的主视觉设计、差异化定位都将被消解。大众最常用的App，从流量控制、用户行为到推荐逻辑、商业模式，都可能被AIOS撼动。更不用说字节和其他大厂业务竞争广泛，电商、短视频、本地生活、社交、AI、游戏等全方位布局，腾讯、阿里、京东、美团、拼多多、携程、快手、百度，没有一家会放心豆包操作自家的App。

如果说华米OV们来做AI手机，应用厂商们还只是出于对范式转移的担忧而采取限制或保持沉默，但如果是字节来做，大厂们就会集体抵制了。这是一种本能的应激反应。

撞墙和拆墙的路

字节是激进的。突然搞出一个AI手机助手，无疑是在和手机大厂和应用大厂同时宣战。但字节也是勇敢的，在利益固化严重，甚至字节自己就是旧范式的最大受益者之一时，主动走出舒适区，探索新的可能性，这种创新精神是值得鼓励的。

整个行业过去十几年始终围绕“注意力—流量—广告”的逻辑构建生态，用户的操作越复杂、停留越久，平台越受益。AI手机的出现从逻辑底层提出了新的方向：如果未来的终端更像个人助理，而不是内容入口，那么用户停留时间、页面点击、跳转深度，这些曾经主宰互联网的指标都将被重塑。

实际上，豆包手机助手和过往那些手机厂商的AI助手类似，依旧停留在非常早期的阶段。无论是字节，还是荣耀、智谱，都在采用一种过渡性的GUI（Graphical User Interface）方案，通过“读屏模拟操作”来调用App。和更理想的意图框架相比，它的最大优势是能绕过App后台授权、从前台直接操作，但难点在于适应界面变化，如果App突然更新设计、按钮位置变了，AI又得重新学习。这些产品都有着成功率低、响应不稳定、耗时长等共性问题，可能用起来还没有人亲自操作更高效，但万事开头难，走出这一步，后面才有机会变得更好。

但第一步就注定会撞到高墙——权限、利益、安全、生态秩序。这些问题无论谁先做，都会发生，字节做，更是会撞得头破血流。

这也是为什么必须有人先来触碰这些壁垒。壁垒越厚，创新者越痛，但如果没有这一撞，用户永远不知道手机能不能变得更聪明，也无法判断真正的“手机智能化”到底应不应该由消费者来决定，而不是由平台利益来决定。

字节选择在此刻站出来，冒着隐私保护、舆论倾向、体验糟糕等风险，把大模型置于真实的手机使用场景里，是一次非常有意义的尝试。

从第一代工程样机三万台的备货量来看，这本身就是一次工程测试，而不是全面商业化的发布。字节或许并不想与其他手机厂商拼体量，而是用最小规模、最可控的方式验证一件事：当用户能够选择更高效的决策方式时，原有的互联网生态是否还能保持曾经的稳定？从用户的热情、样机加价，再到主流应用纷纷触发风控，这台小小的工程样机其实已经给出了答案。

目前，豆包手机助手还远远称不上成熟，它的能力受限于GUI的先天缺陷，也会继续面对权限、系统兼容、风险控制等层层挑战。但在这个初期阶段，它至少证明了一件事：AI手机不是概念机，而是能够通过真实用户场景带来效率提升的东西。

从这个角度看，字节撞上的每一道墙，其实都属于行业必须面对、必须拆解的墙。继续往前走，需要更强的模型、更稳的系统、更严密的隐私边界，也需要建立新的商业分配机制。

最重要的，是需要有对敢为人先的包容。

参考资料

晚点Latepost：《晚点独家丨“豆包手机” 酝酿中，字节为大模型寻硬件载体》

21世纪经济报道：《万字详解智能体：AI手机走“盲道”》

电厂：《“豆包手机”初战遇阻，AI打不破互联网生态壁垒》

中国企业家杂志：《豆包手机刚上线，就被微信淘宝“拉黑”了》

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

如有疑问请发送邮件至：bangqikeconnect@gmail.com

豆包手机助手动了谁的蛋糕？

理想和现实存在差距

与手机、应用厂商的双重矛盾

撞墙和拆墙的路

相关阅读

ai资讯推荐

最新资讯