​联想加码布局AI算力

2024-06-24 21:47 来源:网络 点击:

联想加码布局AI算力

作者 | 刘宝丹

编辑 | 周智宇

面对 AI 带来的确定性机遇,联想提出 AI for All 的愿景,算力就是其中最重要的一环。

近日,联想正式发布了包含服务器、存储、数据网络、边缘在内的算力基础设施新品,包括新一代服务器联想问天 WR5220 G5 等,以及全新 NetApp AFF A 全闪系列、救急 1110 灾备一体化解决方案,联想问天 100G 核心交换机等。

这次发布是对联想 " 一横五纵 "AI 导向的基础设施版图的进一步丰富。纵观联想发展算力的脉络可知,联想算力正在进入快速发展阶段。

去年 8 月,联想正式发布 AI 算力战略,提出全面打造以 AI 为导向的算力基础设施。今年 2 月,联想在巴塞罗那世界移动通信大会(MWC)上首次公布了 " 一横五纵 " 战略,由此揭开了联想对算力基础设施的发展蓝图。" 一横 " 是指联想万全异构智算平台," 五纵 " 包括服务器、存储、数据网络、软件及超融合、边缘基础设施产品和方案。

而在 4 月,联想正式发布了万全异构智算平台。其融合了联想的五大技术创新,是 AI 2.0 时代大模型训练和推理的基础设施底座。联想集团副总裁、中国基础设施业务群总经理陈振宽表示,该平台是 AI 2.0 时代联想基础设施战略框架的核心。

随着这次新产品的发布,无疑将推动联想算力基础设施加快落地。

以新一代服务器联想问天 WR5220 G5 为例,这是一款 2U2S 服务器,主要为云计算、大数据、人工智能中大型数据中心、虚拟化、在线交易、高性能计算、关键业务流和业务协同等场景提供算力。

再比如,全新发布的 NetApp AFF A 全闪存储系列等产品,可为生成式 AI、虚拟化、企业数据库等客户 IT 工作负载提供助力,具备性能提升高达 2 倍、达到经过验证的 6 个 9 的数据可用性等优势。

加快布局背后,联想看中了 AI 人工智能技术迭代所带来的市场机遇,尤其是正在爆发的 AI 算力需求。IDC 预测,到 2026 年中国智算规模将达到 1271.4 EFLOPS,未来五年复合增长率达 52.3%,同期通用算力规模的复合增长率为 18.5%。

正如一个硬币的两面,在市场机遇背后是挑战。世界上的主流科技公司都在重押 AI,联想要想在 AI 算力市场拿下更多份额,必须不断提升实力,以应对激烈的市场竞争。

联想可谓是对 AI 布局最全面的企业之一,从 AI 智能终端、AI 导向的基础设施到 AI 原生的方案服务,联想均有布局。根据财报,2023 年公司研发费用达 148 亿元,研发投入规模约为税前净利润的 6 倍,可见其决心。

作为一家有着 40 年发展历程的科技企业,联想成功穿过多轮技术周期,公司能否在 AI 时代重现昔日的荣光,时间会给出答案。

以下为交流实录(经编辑):

问:以大模型为代表的 AI 技术发展迅猛,对中国算力基础设施提出了哪些要求?

陈振宽:算力在今天人工智能的时代是一个核心的动能。2022 年年底国际上出现了大模型 ChatGPT,引爆了整个大语言模型的需求以后,在人工智能算力上取得了迅猛的发展。过去算力还是以通用算力为基础,大模型让人工智能进入 2.0 时代,每年对算力的需求增速是 10 倍。

整个算力基础设施还是不能非常好地满足对算力的需求的,特别是以 CPU 为算力的基础设施肯定无法再满足人工智能算力发展的需求,包括 GPU、TPU 等等新的加速计算的算力基础设施得到了非常大的关注。在过去一年多的时间里,加速计算从 20% 左右的占比到了去年超过 1/3 的占比,这是算力的发展。

问:未来我国算力产业将如何发展?联想准备如何承接这一趋势?有哪些布局?

陈振宽:算力不仅是对服务器的要求,同时对于高速存储、数据调度同样提出了更加严苛的要求。对于在算力节点之间,集群之间进行计算的调度和协同,对高速连接网络要求也非常高。要能够支持超大规模的训练,支持各种场景的推理,算力弹性要求也非常高。同时,对于节能、散热要求也非常高。

我们在今年首次提出了 " 一横五纵 " 战略框架," 一横 " 是联想万全异构智算平台,可以帮助我们的用户在使用算力基础设施的时候可以更加高效地对算力进行调度。同时异构智算平台可以进行 GPU 虚拟化,支持集合通讯算法库,能够实现分钟级的断电续训,对传统 HPC 科学计算的算力基础设施和 AI 基础设施之间跨集群进行统一调度。

" 五纵 " 包含了服务器、存储、数据网络、软件及超融合、边缘基础设施产品和方案," 五纵 " 在联想过去就已经有了非常全面的布局。但是我们重新为它以 AI 为导向,对它进行重新的打造,对它进行全面的升级,让它更加具备以人工智能,全面 AI 化,能够承接 AI 时代算力的发展。

问:4 月联想和中国智算产业联盟启动了异构智算生态产业联盟,接下来会有哪些计划,对异构智算产业联盟有哪些推动?

陈振宽:联想作为一个在算力产业上的链主企业,有这样一个责任来推动整个产业的发展。我认为,产业联盟成员在三个层面上贡献不同维度的力量。

第一个,AI 芯片层面。国际有非常多的,非常好的 AI 芯片企业。国内也有非常多,尤其这一两年里面在推理上越来越成熟,在训练上越来越先进。

第二个,系统和设备层面。像联想所承担的角色,我们把芯片不同的算力根据不同的应用场景,训练推理的场景,把这些芯片进行更加高效的应用,贡献在产业里面的力量。

第三个,软件和应用层面。比如说像大模型的企业,包括大模型之上再做企业大模型、行业大模型这样一些生态企业。

芯片层、系统设备层、应用软件层,这三个层面缺一不可,整个产业生态联盟也要发挥所有成员之间,他们在几个不同维度上的能力,一起设定标准,一起相互进行更好的融合。

问:这次联想问天和联想 ThinkSystem 四款服务器在定位上有什么样的不同?各自具备什么样的特点?相较于去年在算力大会上发布的两款问天服务器,有哪些技术上的升级呢?

陈振宽:今天我们主要发布的四款服务器,两款联想问天服务器,两款联想 ThinkSystem 服务器。

联想问天这两款是去年发布的下一代产品。第一个是 WR5220 G5,是目前市场上用量最多的产品,具备更高的性能,同时是低功耗的。相较去年,我们融入了更多人工智能管理引擎,能够降低由于部件带来的计划外的宕机,同时也减少部件更换的频率。

第二款是 WA5480 G5,这是一款专门为 AI 设计的训推一体服务器,它支持最多 10 个双宽 PCA 的 GPU,目前可以支持到多品牌的、多厂商的 GPU,不仅仅是国际的,国内的各种 GPU 都可以在上面支持,它在 AI 的训练推理上是最适合的一款 AI 场景下的服务器。

另外两款是联想 ThinkSystem 服务器,一个是 SD520 V4,这是高密度的服务器,非常适合高密部署,高性能计算等等。另外联想 ThinkSystem SR630 V4,它是 1U2CPU 的机型,1U 的服务器主要应用场景还是在云计算、算力租赁。

问:联想万全异构智算平台这一块未来的市场规划是怎么样的?

陈振宽:" 一横 " 是对 " 五纵 " 能力的全面升级,对于我们今天整体布局的基础设施进行重新的改造和升级,实现真正的 AI 导向,这是万全异构计算平台所起到的作用,它将无处不在。

问:联想服务器这几年增速非常迅猛,背后的原因是什么?另外我们看到做服务器企业比较多,我们联想的优势在哪里?

陈振宽:IDC 发布《2024 第一季度中国 x86 服务器市场报告》显示,联想 x86 服务器销售额同比大幅增长 200.2%,市场份额跃升至国内市场第三位。

今年是联想的第 5 个十年的开年,每一个十年联想都经历了一个周期,包括创业期、PC 的时代、国际化的时代、多元化的时代等等,经历了多个周期。我们产品的服务,不管是 PC 还是基础设施遍布全球 180 多个国家和地区,构建的能力是 " 端 - 边 - 云 - 网 - 智 " 五位一体全面的产品能力。联想跻身前三,是 AI 导向基础设施战略稳步推进的结果。

问:我国 AI 服务器总体发展情况怎么样,面临哪些挑战?这次发布了全栈算力基础设施新品,有哪些亮点可以跟我们分享一下。

陈振宽:2023 全年中国加速服务器市场规模达到 94 亿美元,比 2022 年增长 104%。国产芯片性能明显提升,相关产业链逐步形成,与此同时,人工智能芯片的应用场景更加多样化,更有针对性的人工智能芯片正被投资到更精准的细分市场。

联想新一代服务器更是专门为客户 " 匠心打造 ",主打卓越算力、极致能效比和 AI 智能运维智能三大价值主张。首先在性能方面,单处理器核数增加了 2.25 倍,人工智能负载性能提升 2 倍,在云服务器应用场景下每机柜输出性能提升 42%;内存带宽提升 14%,全面支持 CXL 2.0,E3.S 容量提升 2 倍。在能效比方面,处理器每核能耗降低 70%,且全线支持液冷模式,通过 98% 的功耗部件覆盖率实现数据中心 PUE 降到 1.1 以下。在 AI 智能运维方面,可针对关键部件如内存和硬盘的日志进行智能分析,有效规避或减少部件失效次数,从而减少客户计划外停机时间。