商汤大装置：全链路支撑大模型国产化“Day 0适配”

4月28日消息，近期，DeepSeek官宣并开源其新一代旗舰模型V4，全面适配华为昇腾国产芯片。这标志着国产大模型与国产算力进入了“Day 0适配”的新阶段。这要求国产算力集群具备从0到1支撑大模型训练、推理与持续演进的完整能力。据了解，商汤大装置已在基础设施层面完成了这一技术路径的全链条验证，为国产算力规模化落地提供可复制经验。

据介绍，在世界模型方向，开悟世界模型3.0已具备在国产算力集群上完成蒸馏、训练与推理的全流程能力，并完成与沐曦C系列GPU的“Day 0适配”。在这个过程中，开悟3.0采用芯片与模型协同编译方案，结合算子级耗时针对性优化，使模型运行性能直接提升300%，复杂任务处理效率实现大幅跃升。多模态模型方向，Seko系列模型已完成与寒武纪芯片的深度适配，实现从语言到多模态的全面支持；同时依托LightX2V框架的插件化适配能力，可快速对接多种国产硬件，具备良好的生态延展性。

据了解，针对国产化兼容难题，商汤LightX2V框架设计了强兼容的国产化适配插件模式，可快速完成各类国产硬件的适配接入，目前已支持寒武纪、沐曦、海光DCU、昇腾910B等多款主流芯片。此外，针对异构芯片难以协同、大规模训练效率低的难题，商汤大装置构建了基于XCCL与DeepLink的统一异构适配体系。

与此同时，在推理侧，商汤大装置通过Ignite推理引擎启动器，兼容多模型与多引擎体系，通过提供统一API，并在KV Cache管理、多Token预测、算子优化、通信调优上形成全链路能力，实现“一键部署+自适配优化”，显著降低推理门槛。

据悉，从当前产业进展来看，两个趋势已经愈发清晰：一是，国产算力生态正从“可用”走向“可规模商用”。二是，多芯片并存将成为长期常态。在这一背景下，决定竞争力的，不再是单一芯片性能，而是跨芯片适配、异构协同与全栈调度能力等，能够高效管理、调度和优化异构芯片运行环境的基础设施，将成为大模型产业落地的核心支撑。（定西）