4月28日消息,近期,DeepSeek官宣并开源其新一代旗舰模型V4,全面适配华为昇腾国产芯片。这标志着国产大模型与国产算力进入了“Day 0适配”的新阶段。这要求国产算力集群具备从0到1支撑大模型训练、推理与持续演进的完整能力。据了解,商汤大装置已在基础设施层面完成了这一技术路径的全链条验证,为国产算力规模化落地提供可复制经验。
据介绍,在世界模型方向,开悟世界模型3.0已具备在国产算力集群上完成蒸馏、训练与推理的全流程能力,并完成与沐曦C系列GPU的“Day 0适配”。在这个过程中,开悟3.0采用芯片与模型协同编译方案,结合算子级耗时针对性优化,使模型运行性能直接提升300%,复杂任务处理效率实现大幅跃升。 多模态模型方向,Seko系列模型已完成与寒武纪芯片的深度适配,实现从语言到多模态的全面支持;同时依托LightX2V框架的插件化适配能力,可快速对接多种国产硬件,具备良好的生态延展性。
据了解,针对国产化兼容难题,商汤LightX2V框架设计了强兼容的国产化适配插件模式,可快速完成各类国产硬件的适配接入,目前已支持寒武纪、沐曦、海光DCU、昇腾910B等多款主流芯片。此外,针对异构芯片难以协同、大规模训练效率低的难题,商汤大装置构建了基于XCCL与DeepLink的统一异构适配体系。
与此同时,在推理侧,商汤大装置通过Ignite推理引擎启动器,兼容多模型与多引擎体系,通过提供统一API,并在KV Cache管理、多Token预测、算子优化、通信调优上形成全链路能力,实现“一键部署+自适配优化”,显著降低推理门槛。
据悉,从当前产业进展来看,两个趋势已经愈发清晰:一是,国产算力生态正从“可用”走向“可规模商用”。二是,多芯片并存将成为长期常态。在这一背景下,决定竞争力的,不再是单一芯片性能,而是跨芯片适配、异构协同与全栈调度能力等,能够高效管理、调度和优化异构芯片运行环境的基础设施,将成为大模型产业落地的核心支撑。 (定西)