智能手机加速人工智能向现实世界渗透 感知能力成技术竞争新焦点

问题:大模型“会写会画会推理”,但“看不见摸不着” 近一段时间——大模型迭代加快——内容生成、语言理解、逻辑推理等能力不断提升。应用侧,机器人表演、智能终端助手、自动化内容生产等场景持续扩展。但当技术走向现实世界时,行业普遍遇到一道门槛:模型在数字空间表现强,却难以稳定应对真实环境中的光照变化、空间结构、物体运动以及人类行为意图,导致“能回答问题、难处理现场”的落差依然存在。如何让智能系统真正“看见”并“理解”现实,成为落地过程中的关键问题。 原因:算力与参数并非全部,缺少感知体系难以形成闭环 在博鳌亚洲论坛2026年年会上,vivo总裁、首席运营官、vivo中央研究院院长胡柏山指出,人工智能正处在从被动执行走向主动感知与理解的转折点,要进入现实世界必须建立自身的感知体系。业内普遍认为,扩大参数规模与训练数据能提升通用能力,但在对实时性、鲁棒性与安全性要求更高的现实场景中,还需要稳定的输入、准确的空间理解,以及与终端硬件深度协同的能力。随着基础算力和通用模型逐步标准化、平台化,差异化竞争将更多取决于“感知—理解—行动”的完整链路是否打通。 影响:终端将从“工具”转向“场景枢纽”,产业竞争重心或将迁移 胡柏山判断,没有哪个设备比手机更贴近用户,具备全天候陪伴、最大触达规模与更完整的生态连接能力。与可穿戴设备、智能音箱及新兴机器人相比,手机在普及率、交互频次与跨场景承载上仍有优势。业内人士分析,如果这个判断成立,未来较长一段时间内,智能手机不仅是应用入口,还可能成为连接周边设备、汇聚个人数据与场景服务的“感知枢纽”。这也意味着产业竞争将从单点功能比拼,转向系统级体验,包括多模态感知、端侧实时处理、隐私与安全保护,以及与云端能力的协同。 对策:以影像为抓手构建感知底座,推动从底层到应用的链条打通 围绕“如何看懂物理世界”,vivo提出以影像作为感知基础的思路。影像链路覆盖光学、传感器、成像处理、空间计算等环节,能够把真实世界转化为可计算、可理解的数字表达,为场景识别、三维重建、目标跟踪与意图判断提供关键输入。胡柏山表示,公司将持续投入涉及的能力建设,目标是形成从底层硬件与算法到系统平台再到应用体验的全链条协同。业内观察认为,这一路径强调先把感知能力打牢,有助于提升智能功能在复杂环境下的稳定性,减少单纯依赖通用模型带来的不确定性,也更便于在端侧实现快速响应与隐私保护。 前景:从“堆参数”走向“强感知、重体验”,现实落地将更考验长期投入 面向未来,行业普遍关注两条主线:一是通用模型能力持续提升,二是与终端感知、系统工程的深度融合加速。胡柏山提出“未来十年手机仍将是主导载体”的判断,反映出一个趋势:规模化落地往往不是依靠单一颠覆性硬件,而是通过最普及的终端实现渐进渗透。可以预见,围绕感知体系的投入、对典型场景的持续打磨、对安全与合规的体系化建设,将成为企业能否穿越周期的重要变量。随着多设备协同和场景联动增强,谁能率先把“看见—理解—决策—执行”做成稳定闭环,谁就更可能在下一阶段竞争中占据主动。

从“更聪明的回答”走向“更可靠的理解与行动”,是技术进入现实生活的必经之路。谁能在高普及率终端上补齐感知短板,并把能力沉淀为稳定体验,谁就更可能在新一轮产业升级中赢得主动。终端智能的较量,最终回到一个朴素的标准:能否真正看见世界、服务于人。