第三类:用AI颠覆行业的新兴公司。这类公司的核心业务就是AI,大模型是它们的“产品本身”,必须自建才能形成壁垒。比如专注医疗AI的公司,需要开发“AI辅助诊断系统”,要能识别医学影像、分析病历,这就需要用海量的医疗数据自建大模型,形成自己的技术优势;再比如做工业机器人的新兴公司,需要让机器人理解物理世界、自主完成复杂操作,这也需要自建具身智能大模型,而不是靠通用模型“凑合用”。就像中国电信,作为央企,自建了“星辰大模型”,覆盖语义、语音、视觉等多种能力,不仅能服务自己的客服、政务业务,还能开放给其他企业,成为新的业务增长点 。
尤洋特别强调:“自建大模型不是‘越复杂越好’,而是‘够用就好’”。比如中小企业不用建万亿参数的大模型,重点是把自己的专属数据用好,训练出能解决具体问题的“小而美”的模型;传统大企业可以和科技公司合作,不用从零开始,重点是把模型和自己的业务流程打通。总之,自建大模型的核心不是“炫技”,而是“解决自己的专属问题”,这才是企业的核心竞争力。
小主,
四、高通万维星:终端侧大模型才是“刚需”,个性化+隐私安全双保障
提到大模型,很多人会想到“云端”——比如数据传到遥远的服务器上处理,再把结果传回来。但高通公司的万维星却强调:终端侧运行大模型,才是未来的大趋势,核心优势就是“个性化”和“数据本地化处理”。
先解释“终端侧”是什么:就是我们手里的手机、家里的智能家居、身边的机器人这些“终端设备”,终端侧大模型就是把大模型直接装在这些设备上,不用依赖云端,设备自己就能处理数据、完成任务。比如你的手机里装了大模型,不用联网,就能帮你写文案、翻译、整理照片;你的智能手表里装了大模型,能实时分析你的健康数据,给出运动建议。
第一个优势:个性化。云端大模型是“服务所有人”的,没法精准适配每个人的习惯;而终端侧大模型就像“专属管家”,天天跟你打交道,越用越懂你。比如你的手机大模型,知道你喜欢看科技新闻,会优先给你推荐相关内容;知道你不喜欢冗长的文案,会把复杂的报告提炼成简短摘要;甚至知道你的说话语气,帮你发消息时能模仿你的风格,不会显得生硬。高通和中国电信合作的“麦芒”AI手机,就是终端侧大模型的典型例子,它的AI通话助手、AI修图功能,都是基于终端侧大模型,能精准适配用户的使用习惯 。
第二个优势:数据本地化处理,安全又高效。现在很多人担心“用AI会泄露隐私”——比如你把聊天记录、健康数据、工作文件传给云端,万一服务器被攻击,数据就可能泄露。但终端侧大模型根本不用传数据到云端,所有数据都存在你自己的设备上,只有你能访问,安全性大大提高。比如你用终端侧大模型处理工作合同,合同内容不会离开你的电脑;用它分析健康数据,心率、血压等信息只存在你的手表里,不用担心被第三方获取。而且不用联网传输数据,响应速度也更快——比如你让手机大模型整理照片,秒级就能完成,不用等云端处理完再传回来。
万维星说,未来几年,“云+端”协同会成为主流:简单的、需要个性化的任务,交给终端侧大模型;复杂的、需要大量算力的任务(比如大规模数据分析、复杂模型训练),交给云端大模型。比如你用AI写一篇简单的工作周报,手机自己就能完成;但如果要分析公司一年的销售数据,生成详细的可视化报告,就可以调用云端大模型的算力,处理完再把结果传回手机。
现在终端侧大模型已经开始落地:除了AI手机,还有AI眼镜——高通和中国电信合作的天翼AI眼镜,能智能识物、分析食物成分、讲解展品,这些功能都是终端侧大模型实现的,不用依赖云端,随时随地能用 ;还有智能家居,比如你的冰箱里装了大模型,能识别里面的食材,推荐菜谱,还能提醒你食材快过期了,全程不用联网,既方便又安全。
五、自变量机器人王浅:具身智能,AI理解物理世界的“新地基”
前面聊的agent、大模型,大多是在“数字世界”里干活——处理文字、数据、文件;而自变量机器人的王浅,把目光投向了“物理世界”,他提出:具身智能模型是平行于语言模型的“物理世界基础模型”,简单说就是让AI“走进现实,动手干活”。
先区分两个概念:语言模型(比如GPT、通义千问)是“理解数字世界的”,它能读懂文字、分析数据、生成内容,但它不知道“杯子掉在地上会碎”“搬东西要用力”这些物理规律;而具身智能模型是“理解物理世界的”,它能像人一样感知环境、学习物理规律,还能动手执行操作——比如机器人用具身智能模型,能拿起杯子、打开抽屉、走路不摔倒;自动驾驶汽车用具身智能模型,能判断路况、躲避障碍物、平稳转弯。
王浅说,具身智能模型就像AI的“物理课老师”,让AI从“只会纸上谈兵”变成“能动手实践”。比如以前的机器人,只能按照预设的程序干活,一旦环境变了就会出错——比如预设好拿杯子的力度,要是杯子是易碎的,就可能被捏碎;但具身智能模型能通过学习,理解“不同杯子的材质不同,需要用不同的力度拿”,就算遇到没见过的杯子,也能根据物理规律判断该怎么操作。
现在已经有很多具身智能的研发成果,比如北京团队开源的WoW世界模型,能让AI“想象物理世界、预测结果、执行动作”——比如你让它“把杯子放到桌子上”,它能先在脑子里模拟“怎么伸手、怎么抓杯子、怎么放才平稳”,然后再让机器人实际操作,成功率很高。还有工业机器人,用具身智能模型能精准处理复杂的装配任务,比如给汽车零件上螺丝,能根据零件的位置调整力度和角度,不用人工干预;家庭服务机器人,能自己开门、拖地、整理物品,还能避开障碍物,不会撞到家具或人。
小主,
王浅强调,具身智能不是“替代语言模型”,而是和语言模型并行的“另一块地基”——语言模型负责处理“数字信息”,具身智能模型负责处理“物理信息”,两者结合,才能让AI真正融入我们的生活和工作。比如一个智能助手,既能用语言模型帮你处理工作邮件、写报告,又能用具身智能模型帮你整理办公桌、递文件;一个工业AI系统,既能用语言模型分析生产数据、优化流程,又能用具身智能模型控制机器人完成生产操作。
未来,具身智能会渗透到很多领域:制造业的工业机器人、医疗行业的手术机器人、家庭里的服务机器人、自动驾驶汽车、甚至是太空探索机器人,都会依赖具身智能模型,让AI从“数字世界”走进“物理世界”,真正成为能“动手干活”的帮手。
六、PPIO姚星:Agent基础设施,AI时代的“操作系统”
如果说agent是AI时代的“应用程序”,那PPIO的姚星认为,agent的基础设施就是AI时代的“操作系统”——就像Windows、iOS连接电脑、手机的硬件和软件一样,agent基础设施连接着各种agent、设备和人,让它们能协同工作、高效运转。