支持万亿级参数训练!移动云发布大模型训练基地

2024-05-27 10:43:27来源:今日热点网  

5月24日,在中国移动人工智能生态大会上,中国移动宣布开放大模型训练基地、大模型评测基地、大模型产业创新基地等三大人工智能基地,面向全社会提供大模型从训到推、AI+原生应用孵化等的一站式产业融通带动服务,加快大模型产业化、规模化发展。

ebe80a373f8c0419919ea7c010048816

大模型训练基地是中国移动为大模型提供训练所需智算资源及训推一站式工具链的服务平台。基于超万卡智算集群,可为全社会提供超大规模、超长稳定、超高效率的大模型训练服务,并推出两大优惠政策,一个是已经向社会全面开放九天众擎百亿大模型,后续将陆续开放千亿大模型;另一个是提供一定规模普惠算力用于模型共建。针对千亿、万亿大模型训练所需,提供异构算力调度、万卡并行训练、断点自动续训、“通、智、边”一体化训推服务,承载训练及大颗粒算力需求,实现千卡并训任务20天稳定训练,千亿参数模型30天预训练一轮,加速教育、医疗等各行业各场景AI模型稳定开发训练。

大模型训练基地依托移动云算网资源优势,通过提供澎湃算力、高效工具,助力大模型训得更快、训得更稳。

提供澎湃算力

布局覆盖全国的智算中心

中国移动响应国家号召,依托算力网络“4+N+31+X”资源布局体系,按照“集中训练,分布推理,统一管控,弹性调度、自主可控、绿色低碳”原则,统筹规划“N+X”智算中心布局体系,建设技术领先、绿色节能、服务全局的智算中心。中国移动已在京津冀、长三角、粤港澳大湾区、成渝、贵州、内蒙古、宁夏、黑龙江、湖北、山东等投产首批12个智算中心节点,全网智算规模达到17EFLOPS(FP16)。以移动云为算龙头,赋能10万+客户数智化转型。

df7bb7036c9dd92f36f6a80f265b00e8

中国移动智算中心(呼和浩特)节点,是全球运营商最大单体智算中心,并入选2023年度央企十大超级工程,投产后可提供6.7EFLOPS(FP16)的智能算力,满足大规模、低时延、多样化算力需求。

构建高效工具,打造一站式智算平台

——大云震泽智算平台

针对大模型训练特性,移动云打造一站式智算平台产品——大云震泽智算平台,具备异构算力纳管、万卡并行训练、全栈国产化适配、“通、智、边”一体化等优势。

万卡并行,千亿参数大模型快速训练

平台支持大规模训练卡调度,可管理2万智能训练卡规模,支持万亿级参数的大模型训练;训练任务秒级拉起,30天内实现1轮千亿大模型预训练。

断点续训,千卡20天稳定训练

集群、节点、设备全流程支持断点续训,通过综合运用时间优化、断点优化、算子融合优化等方式,总体续训时间不超过30分钟,千卡训练任务最长稳定训练20天。

“通、智、边”调度,一体化训推方便快捷

充分发挥算力网络优势,用户可在通算节点进行数据处理,在智算节点进行模型训练,在边缘节点进行模型推理。基于“大云天穹”算网大脑一体化调度能力,通过数据快递服务,用户可以便捷、安全、高效地进行“通、智、边”节点数据流动。

259dbdb251e04891f0bde0b616b690f3

未来,移动云将继续勇担数字中国建设主力军,持续引领智算资源布局与平台建设,为中国AI产业发展构筑强大基石,为社会各界创造更大价值

 

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

相关阅读

相关词

推荐阅读