国产化适配的第一层是“能跑”。这一阶段的核心目标是完成基本的功能性验证,确保模型能够在目标芯片上启动并完成推理任务。在国产AI发展初期,这是必须跨越的基础门槛,是国产替代的“入场券”,解决了从无到有的问题。但在这一阶段,适配工作往往停留在基础兼容层面,模型性能、运行效率与成本控制均未达到商业化要求,国产算力更多只是作为“备用方案”存在。
第二层是“好用”。随着技术经验的积累,适配工作进入优化阶段。通过基础的算子优化、内存调度和框架调整,使模型在国产芯片上的性能效率提升至可满足实际业务需求的“可用”水平。这一阶段标志着技术方案具备了初步的商业化基础,国产算力开始从“备用”走向“常用”,在部分场景中能够替代进口方案完成核心任务。但此时的适配优化仍以通用场景为主,尚未充分结合具体硬件架构特性与行业场景需求,性能表现与成本优势仍有提升空间。
第三层是“极致”。这是2025年国产AI适配工作的核心方向,也是头部企业的竞争焦点。它要求超越通用优化的局限,基于特定硬件架构的特性进行深度的软硬件协同设计,甚至重新思考算法与模型的实现方式,从而充分释放芯片潜力,最终实现在特定场景下的性能表现超越行业通用基准。抵达这一层,意味着国产方案不仅能够替代进口产品,更具备了独特的竞争优势,成为市场选择中的“最优解”而非“无奈之选”。
商汤与寒武纪在2025年的深度合作,正是朝着“极致”适配的目标迈进,而这一目标的实现,植根于商汤技术体系两个设计上的先天优势,这也是其能够在2025年引领适配潮流的核心原因。
首先是架构级的硬件友好基因。商汤的LightX2V实时视频生成框架,在架构设计中便预埋了“国产化适配插件模式”,这种设计并非在技术栈定型后打上的补丁,而是源于系统级的前瞻思维。这一模式使得针对不同国产芯片的深度优化能够以模块化、低耦合的方式高效集成,大幅降低了适配难度与性能损耗。同样,其Seko系列模型原生支持低比特量化、稀疏注意力等先进的模型压缩与加速机制,这些特性能够让模型更自然地适配国产芯片的存储体系和计算单元,使国产芯片上的推理性能提升3倍以上成为现实。
从源头开始的协同设计,让商汤在与寒武纪的“Day 0”适配中展现出惊人效率。在Seko 2.0发布前,双方团队已基于长期合作积累的技术经验,完成了核心算法与芯片架构的预适配,发布当日仅需完成最终的验证与调试,便实现了模型在寒武纪芯片上的高效运行,且在模型效率、算力增强、资源利用率等方面取得了显着成果。这种“发布即适配”的行业标杆,正是架构级友好设计的最佳佐证。
小主,
更深层的优势,在于场景驱动的优化闭环。商汤构建了从AI大装置(算力层)、大模型平台(平台层)到丰富行业应用(落地层)的完整垂直整合生态,并通过“1+X”战略实现落地。在这一生态体系中,来自金融、工业、医疗、消费等一线场景的真实、高要求需求,能够自上而下驱动“日日新”大模型的定向优化;而每一次模型优化,又能在商汤底层SenseCore AI大装置上,与寒武纪等国产芯片进行软硬协同的极致调优;最终,优化成果直接转化为客户端的时延降低、吞吐量提升与总拥有成本(TCO)下降,形成“需求-优化-落地-反馈”的完整闭环。
2025年7月,商汤宣布接入由上海AI实验室推出的DeepLink开放计算体系,进一步强化了这一优化闭环的效能。通过异构混合调度方案,商汤成功解决了不同架构国产芯片的协同通信与统一调度问题,并能自动进行并行策略优化和负载均衡,显着提升了异构调度和弹性算力能力。这一技术突破,让商汤智算中心能够同时调度华为昇腾、寒武纪、沐曦等多种国产芯片组成的混合集群,实现“不同芯片,同一平台”的高效运行,为超大规模模型训练与推理提供了更灵活、更高效的算力支撑。
此外,商汤与记忆张量合作的PD分离商用推理集群,在2025年的真实C端负载测试中取得了亮眼成绩:单卡并发效率提升20%、吞吐提升75%,综合推理性价比达到英伟达A100的150%。这一数据充分证明,通过深度的软硬件协同优化,国产AI方案已在性价比上实现对国际主流产品的超越,为高性能模型的大规模商业化落地打开了降本增效的空间。
在端侧应用领域,适配优化的成果同样显着。基于日日新V6.5大模型的AI办公助手“小浣熊”,已完成对多种国产芯片一体机、PC的适配优化,并针对个人PC场景进行了深度调优,确保模型精度与云端保持一致。2025年世界人工智能大会上发布的全国产智能办公一体机,就搭载了“小浣熊”AI助手,基于全国产的硬件、系统与模型,实现了全链路自主可控的端侧AI应用方案,为政府、国企等关键领域的智能化转型提供了安全可靠的选择。
破解“不可能三角”:2025年生态共荣定义国产AI新范式
国产AI发展多年来始终面临一个经典的“不可能三角”困境:自主可控、高性能、低成本三者难以兼顾。在传统认知中,追求极致的自主可控与高性能,往往意味着需要投入高昂的研发成本与定制化费用;而若要严格控制成本,又可能不得不妥协于技术性能或承担供应链安全风险。这一三角难题,长期制约着国产方案从“可用”迈向“好用”与“敢用”,也成为阻碍国产AI生态规模化发展的核心瓶颈。
而商汤科技的实践之所以在2025年备受关注,关键在于其没有采用非此即彼的妥协策略,而是凭借贯穿“算力-平台-应用”的垂直生态布局,将单一企业的系统能力升维为整个产业的平台化生态能力,通过全产业链的协同创新,在“不可能三角”中找到了动态平衡的最优解,为国产AI的可持续发展提供了可复制的实践路径。
在成本控制层面,商汤的核心突破在于生态资源的整合与共享。2025年7月,在世界人工智能大会期间,商汤联合华为昇腾、寒武纪、沐曦、摩尔线程、壁仞科技等十余家国产生态伙伴,共同发布了“商汤大装置算力Mall”,成为最早支持全栈国产的AIDC大装置试验场之一。这一平台的核心定位是“面向未来的算力超级市场”,旨在打破国产算力资源分散、整合度低的行业痛点,提供从硬件到平台服务的全生态灵活产品矩阵。
在“算力Mall”的生态逻辑下,所有接入的国产芯片都经过了商汤的深度适配与优化,形成了标准化的算力服务模块;开发者与企业用户无需自建算力集群,也无需承担高昂的技术适配成本,即可像在电商平台购物一样,根据自身需求自由组合和调配多样化的算力资源、工具和模型服务,实现“即插即用”的便捷体验。这种模式将国产AI的尝试门槛从重资产的基础设施投资,降低为轻量级的服务采购,从根本上改变了国产AI的成本结构,让中小企业也能轻松享受到高质量的国产算力服务。
根据中国通信工业协会发布的《全球重点区域算力竞争态势分析报告》,2025年国内头部科技企业的AI算力投入预计将达4500亿元,其中30%用于国产芯片验证与适配,70%用于算力基础设施建设。“商汤大装置算力Mall”的出现,有效盘活了这部分巨额投入形成的算力资源,避免了重复建设与资源浪费,通过集约化、平台化的运营模式,显着降低了全行业的算力使用成本,让国产AI的成本优势得到充分释放。