面向大模型训练,腾讯发布超强算力集群,性能提升三倍! - 市场热点 - 华西证券
logo
立即开户
  1. 华西证券
  2. 市场热点
  3. 文章详情

面向大模型训练,腾讯发布超强算力集群,性能提升三倍!

资讯来源:华彩人生APP
华西证券官方应用,综合性金融证券交易平台。
发布时间:2023-04-14 13:58

就在刚刚,腾讯发布了号称国内性能最强的大模型计算集群。

据腾讯微信公众号4月14日消息,腾讯云正式发布面向大模型训练的新一代HCC(High-Performance Computing Cluster)高性能计算集群。

该集群采用腾讯云星星海自研服务器,搭载英伟达最新代次H800 GPU,服务器之间采用业界最高的3.2T超高互联带宽,为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。

据腾讯介绍,实测显示,新一代集群整体性能比过去提升了3倍,是国内性能最强的大模型计算集群。

早在去年10月,腾讯训练框架AngelPTM,完成了首个万亿参数大模型训练——混元NLP大模型训练。在同等数据集下,将训练时间由 50 天缩短到 11 天。如果基于新一代集群,训练时间将进一步缩短至 4 天。

针对大模型场景,星星海自研服务器采用 6U 超高密度设计,相较行业可支持的上架密度提高 30%;利用并行计算理念,通过 CPU 和 GPU 节点的一体化设计,将单点算力性能提升至更高。

除此以外,H800 GPU也是新集群的一大看点。公开资料显示,H800为英伟达旗下最先进的芯片之一,对人工智能研发极为重要,其算力超过旗舰芯片A100三倍,这也是国内首次发布搭载H800的大模型产品。

网络层面,腾讯发布自研的星脉网络能提供3.2T通信带宽,为业内最高数据。

腾讯表示,搭载同样的GPU卡,3.2T星脉网络相较前代网络,能让集群整体算力提升20%,使得超大算力集群仍然能保持通信开销比和吞吐性能。并提供单集群高达十万卡级别的组网规模,支持更大规模的大模型训练及推理。

存储层面,几千台计算节点同时读取一批数据集,需要尽可能缩短加载时长。腾讯云自研的文件存储、对象存储架构,具备TB级吞吐能力和千万级IOPS,满足大模型训练的大数据量存储要求。

新一代集群还集成了腾讯云自研的 TACO 训练加速引擎,对网络协议、通信策略、AI 框架、模型编译进行大量系统级优化,大幅节约训练调优和算力成本。

另外,腾讯自研芯片已经量产,包括用于AI推理的紫霄芯片。它采用自研存算架构和自研加速模块,可以提供高达3倍的计算加速性能和超过45%的整体成本节省。

在上月召开的电话会议上,腾讯方面表示,未来将投入大量资源并建立自己的基础模型,并将其整合进公司的所有业务中。不过腾讯表示,将做对的事,不会仓促行事。

腾讯还说,AIGC可以用来提升腾讯旗下旗舰产品的用户体验。未来可能每一个用户都会有人工智能助理,如果效果好,有可能将生成式AI纳入微信和QQ。

 
 
华西证券网上快速开户通道,点此下载开户
华西证券网上快速开户通道,点此下载开户

免责声明
本文内容仅为投资者教育之目的而发布,不构成投资建议。投资者据此操作,风险自担。我司力求本文所涉信息准确可靠,但并不对其准确性、完整性和及时 性作出任何保证,对因使用本文引发的损失不承担责任。股市有风险,投资需谨慎!

更多相关文章

华西证券
×
华西证券优选
微信扫描二维码 ×
华西证券优选
微信扫描二维码 ×
华西证券优选