2. 三步走开放路线图,共建国产算力硬件生态
海光信息为HSL总线协议制定了清晰的开放路线图,分阶段推动协议标准化与生态化建设,目标是打造成为国产算力产业的统一互联标准:
- 短期目标(1年内):开放HSL总线的基础互联协议与IP核授权,支持寒武纪、壁仞科技、沐曦集成电路等主流国产AI芯片厂商的产品与海光CPU直连,降低异构算力集群的集成门槛;同时联合光合组织成员单位,开展兼容性测试与认证工作,发布首批兼容HSL协议的硬件产品名录。
- 中期目标(2-3年):逐步开放HSL总线的底层接口与Chiplet互联规范,推动多厂商芯片的模块化组合,支持不同功能的芯粒通过HSL总线实现异构集成,打造“算力积木”式的硬件开发模式;此外,构建超节点算力集群的技术标准,支持数千颗芯片的协同计算,满足国家重大科研项目与超大规模AI应用的算力需求。
- 长期目标(3年后):推动HSL总线协议成为行业公认的国产算力互联标准,联合政府、科研机构与产业链上下游企业,共建开放共享的硬件生态平台,打破国外技术垄断,实现国产算力硬件的自主可控与协同发展。
3. 典型场景落地:赋能大模型训练与行业算力集群建设
HSL总线协议的技术优势,在实际应用场景中得到了充分验证。在千亿至万亿参数大模型训练场景中,基于HSL总线协议构建的32路CPU+64路DCU超节点算力集群,实现了节点间数据的微秒级传输,模型训练的迭代效率提升25%,同时支持故障节点的快速检测与切换,确保训练过程不中断,大幅降低了大模型训练的风险。在制造业的智能工厂场景中,HSL总线协议让AI加速卡与CPU协同处理生产线的高清图像数据流,实时完成产品缺陷检测,检测效率提升40%,误检率降低15%,助力制造企业实现高质量、高效率的生产。在金融行业的高频交易场景中,HSL总线的低时延特性,让算力系统能够在极短时间内完成市场数据的分析与交易决策,为金融机构赢得市场先机。
三、开放软件栈:打造“中国版CUDA”,让国产AI开发“降本增效”
硬件的强大离不开软件生态的支撑,海光信息在发布“双芯战略”的同时,同步推出了DTK、DAS、DAP三层全栈式开放软件栈,覆盖从底层异构编程到上层行业应用的全链路,构建起开放统一的国产AI软件生态,解决了“开发难、迁移贵、适配慢”的行业痛点,目标是打造比肩NVIDIA CUDA的“中国版CUDA”,为开发者提供高效、便捷的开发工具与环境。
1. DTK异构计算平台:跨芯片编程的“统一工具箱”
DTK(Hygon DCU Toolkit)是海光信息推出的底层异构计算开发平台,其核心亮点是openHygon统一编程工具包与HygonTK统一映射接口,旨在让开发者通过一套代码,即可适配海光双芯架构与其他主流国产芯片,无需进行重复开发与调试。
DTK平台全面兼容TensorFlow、PyTorch、MindSpore等主流深度学习框架,支持FP32、FP16、BF16、INT8等全精度计算模式,可覆盖大模型训练、端侧推理、科学计算等全场景需求。平台内置的编译器优化技术与算子融合算法,能够自动识别代码中的性能瓶颈,对计算任务进行智能调度与优化,将海光DCU的算力利用率提升至92%,超越行业平均水平。此外,DTK平台还提供了完善的性能分析工具与调试环境,开发者可实时监控算力资源的使用情况,快速定位代码中的问题,开发效率提升**60%**以上。
2. DAS基础软件系统:AI应用开发的“高效加速器”