请选择 进入手机版 | 继续访问电脑版
分享
首页 门户 社会要闻 查看内容

保障运算减少能耗 创新液体冷却技术让数据中心更环保

发表于 2024-8-12 10:37 |原作者: 迪拜网
33 0
摘要: 生成式人工智能的发展依赖强大的计算能力,但数据中心却是用电大户。数据中心业者Sustainable Metal Cloud(简称SMC),通过冷却液体降温、减少输出的电子数量等方式,在保障运算能力之际,也将打造绿色数据中心,电 ...
生成式人工智能的发展依赖强大的计算能力,但数据中心却是用电大户。数据中心业者Sustainable Metal Cloud(简称SMC),通过冷却液体降温、减少输出的电子数量等方式,在保障运算能力之际,也将打造绿色数据中心,电源使用效率优于资讯通信媒体发展局设立的标准。
设在新科电信媒体(ST Telemedia)数据中心大楼的SMC数据中心“可持续人工智能工厂”,通过微调LLaMa-2-70B大语言模型(LLM),能源消耗比传统方式所需电力减少了45%,每个节点每月产生的二氧化碳也减少2.21吨。
根据长期以来驱动全球数码革命的摩尔定律(Moore’s Law),微晶片上可容纳的晶体管数量,每两年翻倍,也就是说微晶片的性能可以提高一倍。近年来在人工智能领域出现的“新摩尔定律”则主张,未来计算能力的提升,将更多依赖于异构计算(heterogeneous computing)、3D晶片堆叠等创新技术,而非仅靠晶体管密度的增加。

  
 
SMC联合创始人兼联合首席执行官柯蒂斯(Oliver Curtis)指出,英伟达的Blackwell B100图像处理器(GPU)机架的热设计功耗(thermal design power, 简称TDP)已经高达70kW(千瓦)。然而,全球数据中心基本上都是为容纳约10千瓦的机架而建造的,仅有5%的数据中心可以处理至少50千瓦的TDP。
TDP是指中央处理器(CPU)或图像处理器在运行应用程序达到最大负荷时,可产生的热量。
柯蒂斯说,SMC在新加坡的数据中心采用液体冷却技术,电源使用效率(power usage effectiveness,简称PUE)仅为1.1。以英伟达的H100图像处理器为例说,若一个数据大厅全是H100图像处理器,能耗可高达14千瓦,但在SMC的数据中心,则可降低至7.7千瓦。
H100已成为全球人工智能业界训练大语言模型和运行生成式AI的热门图像处理器选择。
柯蒂斯说:“如果你能负责任地推广可持续的人工智能,那你应该确保减少用于模型相同性能的输出的电子(electron)数量……我们在新加坡拥有最先进的冷却平台之一。这个平台已证实能在确保一样性能的输出时,显著降低总电子数量。”

  
   
    延伸阅读
   
  
   
      
   新电信与英伟达等签合作备忘录 拓展区域数据中心业务
  
  
   
      
   我国晶片业者Silicon Box成独角兽 估值超10亿美元
  
 
根据今年6月发布的MLPerf(Machine Learning Performance)数据,与传统风冷数据中心托管的GPU云相比,参与了GPT-3 175B以及512 H100张量计算核心(Tensor Core)GPU测试的SMC数据中心,可节省最多五成的能源。
MLPerf基准测试是由学术界和工业界共同组成的非营利性组织,旨在建立一个公平、透明且可复现的机器学习性能评估平台。
与德勤合作 以可持续方式推动企业客户接触人工智能
今年7月,SMC还宣布与咨询公司德勤(Deloitte)合作,以最可持续的方式让企业客户接触人工智能。
本地数据中心的用电量占全国总量的约7%。一座数据中心要达到建设局与资媒局的绿色建筑标志白金认证,其PUE至少须达到1.3,数值越低表示效率越高。在此基础上进一步优化PUE,已成业界追求的目标。我国数据中心容量将在下来几年增加至少300兆瓦(MW),“绿色数据中心路线图”将为使用绿色能源的数据中心经营者,额外保留200兆瓦的容量。
我国于2024年5月30日正式推出绿色数据中心路线图,重点在于继续在硬件及软件层面改善能源效率、加速推动数据中心使用绿色能源这两方面,优化本地数据中心的可持续发展。
为支持具1.3或更低PUE的节能数据中心的发展和运营,资媒局将与业界共同制定要求更高的标准及认证。



© 2013-2016