为什么机器学习模型会消耗那么多能源?
人脑是一种效率极高的智能来源,但目前的AI还达不到这样的水平。
本月早些时候,OpenAI宣布已经构建起有史以来规模最大的AI模型。这套惊人的模型名为GPT-3,已经成为令人印象深刻的伟大技术成就。但在这辉煌的背后,也凸显出人工智能领域一种令人担忧的负面趋势——更可怕的是,主流舆论对此尚未给予足够的关注。
现代AI模型需要消耗大量电力,而且对电力的需求正以惊人的速度增长。在深度学习时代,构建一流AI模型所需要的计算资源平均每3.4个月翻一番;换句话说,从2012年到2018年间,AI计算资源消耗量增长了30万倍。而GPT-3,只是这股潮流的最新体现。
总而言之,AI技术带来的碳排放已经不容忽视;如果行业趋势继续下去,那么情况将很快失去控制。除非我们愿意重新评估并改革当今的AI研究议程,否则人工智能领域很可能在不久的未来成为引发气候变化的罪魁祸首。
更大并不一定更好
在当今以深度学习为中心的研究范式当中,人工智能的主要进步主要依赖于模型的规模化扩展:数据集更大、模型更大、计算资源更大。
GPT-3就很好地说明了这种现象。这套模型中包含多达1750亿个参数。为了帮助大家更直观地理解这个数字,其前身GPT-2模型(在去年发布时,同样创下了体量层面的纪录)只有15亿个参数。去年的GPT-2在拥有千万亿次算力的设备上训练了几十天;相比之下,GPT-3的训练时长将增长至数千天。
这种靠“每况愈大”模型推动AI技术进步的问题在于,这类模型的构建与部署都需要消耗大量能源,并由此产生巨量碳排放。
在2019年的一项广泛研究当中,由Emma Strubell牵头的一组研究人员估计,训练一套深度学习模型可能产生高达62万6155磅的二氧化碳排放量——大约相当于五辆汽车从出厂到报废的总二氧化碳排放规模。如果这还不够直观,那么每个美国人每年平均产生3万6156磅二氧化碳排放量。
可以肯定的是,这项估算主要针对那些高度依赖于能源的模型。毕竟结合当前现实,机器学习模型的平均训练过程绝不至于产生60多万磅二氧化碳。
同样值得注意的是,在进行这项分析时,GPT-2仍然是研究领域规模最大的模型,研究人员也将其视为深度学习模型的极限。但仅仅一年之后,GPT-2就成了“纤细瘦小”的代名词,下代模型的体量超过其百倍。
为什么机器学习模型会消耗那么多能源?
最重要的原因,就是训练这些模型的数据集本身也在快速增肥。在使用包含30亿个单词的数据集进行训练之后,BERT模型在2018年实现了同类最佳的自然语言处理(NLP)性能。而在利用包含320亿个单词的训练集完成训练之后,XLNet又超越了BERT。不久之后,GPT-2开始在包含400亿个单词的数据集上接受训练。最终是我们前面提到的GPT-3,它使用的是一套包含约5000亿个单词的加权数据集。
在训练过程中,神经网络需要为每一条数据执行一整套冗长的数学运算(正向传播与反向传播),并以复杂的方式更新模型参数。因此,数据集规模越大,与之对应的算力与能源需求也在飞速增长。
导致AI模型大量消耗能源的另一个理由,在于模型开发过程中所需要的大量实验与调整。目前,机器学习在很大程度上仍是一个反复实验试错的流程。从业人员通常会在训练过程中为当前模型构建数百个版本,并通过不断尝试各类神经架构与超参数确定最佳设计方案。
之前提到的2019年论文中还包含一项案例研究,研究人员们选择了一个体量适中的模型(显然要比GPT-3这样的庞然大物小得多),并对训练其最终版本所需要的电力、以及生产最终版本所需要的试运行总量进行了统计。
在为期六个月的过程中,研究人员共训练了该模型的4789个不同版本,折合单GPU运行时长为9998天(超过27年)。考虑到所有因素,研究人员们估计,该模型的构建过程将产生约7万8000磅二氧化碳,超过美国成年人两年的平均二氧化碳排放量。
而到这里,我们讨论的还仅仅是机器学习模型的训练部分。而训练只能算是模型生命周期的开始;在训练完成之后,我们还需要在现实环境中使用这些模型。
在现实环境中部署并运行AI模型(即推理过程),所带来的能源消耗量甚至高于训练过程。实际上,英伟达公司估计,神经网络全部算力成本中的80%到90%来自推理阶段,而非训练阶段。
例如,我们可以考虑自动驾驶汽车中的AI模型。我们需要首先对该神经网络进行训练,教会它驾驶技巧。在训练完成并部署至车辆上之后,该模型将持续不断地进行推理以实现环境导航——只要汽车仍在行驶,模型的推理过程就将不间断地进行。
毋庸置疑,模型中包含的参数量越大,推理阶段所带来的电力需求就越夸张。
能源使用与碳排放
要探讨这个问题,我们先要找到能源使用与碳排放之间的对应关系。那么,该如何准确判断这种对应关系?
根据美国环保署(EPA)公布的数据,在美国,一千瓦时电力平均对应0.954磅二氧化碳排放量。这一平均值反映了碳足迹变化以及美国电网当中的不同电力来源(包括可再生能源、核能、天然气以及煤炭等)的客观比例。
如上所述,Strubell在分析中采用了美国本土的电力碳排放平均值,以根据不同AI模型的能源需求计算对应的碳排放量。这个假设已经相当合理,因为Amazon Web Services的电力组合就一致符合美国整体的发电来源结构,而目前的大多数AI模型都会选择在公有云端进行训练。
当然,如果尽可能使用可再生能源产生的电力进行AI模型训练,其碳足迹必将有所降低。例如,与AWS相比,Google Cloud Platform的电力结构中可再生能源的比例更高(根据Strubell的论文,AWS的可再生能源占比17%,谷歌方面则占比56%)。
我们也可以再举个例子,由于所在地区拥有丰富的清洁水电资源,因此大西洋西北部区域的硬件设施在训练模型时所产生的碳排放将低于全美平均水平。值得一提的是,目前各大云服务供应商都在强调其在碳排放控制方面做出的努力。
但总体来说,Strubell认为美国的整体电力组合仍然具有充分的说服力,可用于大体准确地估算出AI模型的碳足迹。
收益递减
模型体量与模型性能之间的关系,则能帮助我们了解提升模型规模到底能够给AI技术发展带来怎样的帮助。这方面数据倒是非常明确:模型体量的持续增加,最终会导致性能回报急剧下降。
我们用实例来证明这个观点。ResNet是一套于2015年发布的知名计算机视觉模型。该模型的改进版本名为ResNeXt,于2017年问世。与ResNet相比,ResNeXt需要的计算资源提升了35%(按总浮点运算量计算),但精度却只增长了0.5%。
在艾伦人工智能研究所2019年发表的论文中,我们可以看到更详尽的比较数据,其中记录了不同任务、模型与AI子领域的模型规模收益递减情况。与GPT-2相比,最新发布的超大型GPT-3模型也出现了显著的收益递减迹象。
如果AI社区继续沿着当前的道路前进,那么研究人员们必然需要花费更多精力构建起越来越大的模型,但由此带来的性能提升却越来越小。这意味着成本/收益率将变得愈发不相称。
既然收益递减客观存在,为什么人们还在不断推出越来越大的模型呢?一大主要原因,在于AI社区当下仍过于关注能在性能基准测试中创下新高的“最新”纪录。在众所周知的基准测试中拿下新顶点的模型(即使仅提升一个百分点),也能赢得研究人员们的一致认可与好评。
正如加州大学洛杉矶分校(UCLA)Guy Van den Broeck教授所言,“我认为比较准确的比喻,就是某个盛产石油的国家能够建造一座很高的摩天大楼。在摩天大楼的建造过程中,当然能够帮国家积累下「最先进的技术」。但这一切……无法带来任何科学意义上的进步。”
目前,AI研究议程领域这种“越大越好”的偏执精神很可能在未来几年给自然环境造成重大破坏。这就要求我们在深思熟虑之后进行大胆变革,将人工智能重新引导到持续性更强、生产力水平更高的正确轨道上。
展望未来
首先,每一位AI从业者应该尽快将“缩短周期”作为研究目标,借此降低技术发展对环境造成的影响。
而最重要的第一步,就是增强AI模型碳排放问题的透明度与量化考核。当AI研究人员发布新模型的研究结果时,除了性能与精度两项核心指标之外,还应该附上模型开发过程中的总体能源数据。
经过认真分析,艾伦人工智能研究所的团队提出将浮点运算作为研究人员们最通用也最准确的能效衡量标准。另一支小组也创建出一款机器学习碳排放计算器,可帮助从业者们借此估算当前模型的碳足迹(其中涵盖硬件、云服务供应商以及地理区域等诸多因素)。
遵循这些思路,研究人员们还需要在模型训练过程中,将能源成本与性能收益之间的关系作为不能回避的重要度量。明确量化这项指标,将促使研究人员们重要收益递减问题,进而在资源分配上做出更明智、更平衡的决策。
希望随着可持续AI实践的普及,技术社区能够在评估AI研究时着重考虑这些效率指标,并把这些指标的重要性提高到精度等传统性能指标的水平,最终使其在论文发表、演讲分享以及学术成果等领域发挥更重要的作用。
当然,其他一些方法也有望在短期之内帮助AI模型减少碳排放:使用更高效的超参数搜索方法、减少训练过程中不必要的实验次数、采用更节能的硬件等等。
但单靠这些补救性的措施,不足以彻底解决问题。人工智能领域需要在根本上做出长期转变。
我们需要退后一步,承认单纯建立越来越庞大的神经网络并不是通往广义智能的正确路径。从第一原理出发,我们必须逼迫自己去发现更优雅、更高效的方法,对机器中的智能进行建模。我们与气候变化的斗争,甚至是整颗蓝色星球的未来,可能也都将维系于此。
引用AI界传奇人物、深度学习教父Geoff Hinton的名言,“未来可能掌握的某些研究生手里,因为他们对我所说的一切深表怀疑……他们可能会彻底抛弃我的观点,从零开始再次探索。”
AI社区必须敢于建立人工智能的新范式,这些范式既不需要指数级增长的数据集、也不需要恐怖的电力消耗。小样本学习等新兴研究领域,也许会成为我们走向光明未来的新道路。
作为最初的智能来源,人脑也将给我们带来重要启发。与目前的深度学习方法相比,我们的大脑非常高效。人脑仅几磅重,运行功率约20瓦——只够让低功率灯泡亮起昏暗的光。然而,它们却也代表着宇宙中当前已知的最强大的智能形态。
AI研究人员Siva Reddy也不禁感叹,“人脑只需要极低的功耗,就能达成令人惊奇的表现。问题在于,我们如何才能制造出这样的机器。”
标签: 模型会消耗那么多能源
相关阅读
-
api-ms-win-core-bicltapi-l1-1-0.dll文件丢失如何修复?|热点在线
api-ms-win-core-bicltapi-l1-1-0 dll通常存储在Windows操作系统的系统
2023-06-08
精彩推荐
阅读排行
相关词
- 世界讯息:小女巫奥莉维亚的魔法商店官网在哪下载 最新官方下载安装地址
- 比亚迪推出10万元内新SUV车型 焦点热议
- 世界速看:公共 | 河北省石家庄市井陉县文旅局关爱未成年由“送文化”到“种文化”传承优秀文化
- 环球短讯!剑影寻光官网在哪下载 最新官方下载安装地址
- 河南省渑池县持续优化营商环境激发经营主体活力_今日快看
- 四川省市场监管局全力助推个体私营经济高质量发展 聚看点
- 旅游 | 河东文旅精品“引燃”美丽深圳 环球热文
- 国家金融监督管理总局:要真正实现金融监管“全覆盖 无例外”-焦点播报
- “第一生育大省”广东作部署:支持有条件地区发放育儿补贴 全球信息
- 坐竹筏被筏工索要红包?广西阳朔:景区公司暂停涉事人工作2个月
- 天天速读:两部门印发通知:举办全国和美乡村篮球大赛
- 向海图强!海洋经济“扬帆远航”_环球讯息
- csgo国服不能开箱子吗?csgo国服开箱子详细介绍
- wmvdspa.dll损坏修复方法
- 如何解决出现olepro32.dll加载错误的问题
- Win7运行Wegame蓝屏出现该怎么应对
- 天天要闻:实控人被列入失信被执行人名单,加加食品的股价持续下跌
- storport.sys蓝屏无限重启应该如何应对
- 潘功胜回应汇率波动:我国外汇市场将有条件保持较为平稳运行状态
- 德阳市旌阳区人大常委会调研区农村集体经济发展情况
- 新疆皮山机场新建工程选址报告获中国民航局批复 环球速看料
- 每日观点:政府当“红娘”,企业来“相亲” 这场产销对接会为四川纺织服装产业送福音
- 德阳市旌阳区双东镇“三强化”提升基层人才能力|世界快消息
- 浙江空管分局首次建设完成国产化导航台设备
- 顶烈日 战高温 什邡公安交警为高考保驾护航
- 世界微资讯!线上线下齐发力 全民共享“四川非遗购物节”
- 世界快讯:移动廊道亮相广州白云机场 为远机位乘机旅客撑“伞”
- 天天快看点丨海南海洋乐园大盘点~别收藏,我怕你玩不过来
- 山东机场:强化“四心宣讲”奏响“空港乐章”|每日动态
- 天津航空:为旅客提供安心的出行保障
- 【环球播资讯】南充蓬安:护航高考 交警同行
- 南充顺庆:爱心助考 “电”亮未来
- 环球热资讯!emulator64.dll丢失如何修复
- PEX启动蓝屏出现应该如何应对 世界简讯
- 践行“绿水青山就是金山银山”通过设立巡逻队来禁止渔民非法采集珊瑚 并吸纳渔民进入景区就业|环球微头条
- 2023年6月大学生村官考试公告汇总
- 环球快报:生存冒险游戏《血清》新预告 支持简体中文
- 天天最资讯丨应急管理部:今年以来生产安全事故起数和死亡人数持续下降 但重特大事故有所反弹
- 微动态丨威高骨科:脊柱、创伤、关节三大领域全部集采并落地执行
- 康泰医学:暂无脑机接口相关产品
- 士兰微:65亿定增获证监会批文 IDM龙头加速汽车芯片产品升级
- 李云泽:下好风险前瞻防控先手棋 以更加主动态度应对风险隐患-全球今亮点
- 全球热讯:中级经济师《金融》每日一练(2023.06.08)
- 腾讯《无畏契约》国服今日终测 20名英雄爽玩 天天报资讯
- 永远杀不完 任天堂发布《塞尔达》历代总BOSS加农集锦_焦点速读
- 世界新资讯:君禾股份:未来预期随着海外库存消耗及消费市场逐步复苏 水泵主业会呈现复苏反弹
- 2023山西太原市古交市招聘社区专职社工体检和考察公告_天天时快讯
- 易纲:坚决把绿色金融工作摆在突出位置,实现“3060”目标需要胡萝卜加大棒
- 2023年山东泰安肥城市城市社区专职工作者招录进入面试范围人员递补名单(第三批)_时讯
- 每日看点!隔夜SHIBOR报1.3390% 下降6.50个基点 7天SHIBOR报1.8500%
- 世界快播:华菱钢铁:目前废钢资源相对稀缺成本较高,长流程炼钢更具经济性
- 全球消息!易会满:进一步打通痛点堵点,为机构投资者入市创造更加有利环境
- 《神秘岛》开发商新作《苍穹乾坤》使用AI辅助开发 引众筹者不满
- 天天头条:五大行再次下调存款利率
- 客人去哪了?五一后各地餐饮生意直线下滑,突然就没人了
- 当前快看:理想汽车在青岛成立销售公司
- 潘功胜:中国稳健金融周期为经济和金融市场运行提供适宜环境
- 美国社交电商再起波澜:TikTok商城开张,Meta却要闭门做生|今日快看
- 世界快资讯:上海再保险“国际板”正式启动
- 特别好评RPG游戏《恐怖的世界》 完整版10月19日上线|环球精选
- 易会满:持续加大对伪私募、地方交易场所等重点领域风险的整治
- 十元店重回巅峰:新穷人与日本1990s
- 每日快报!教育股震荡走低 国新文化跌超8% 荣信文化跌逾7%
- 全球快讯:央行潘功胜:人民币债券具有良好的投资组合分散化价值
- 国产大飞机开启常态化商业运行:C919带动产业链一起飞 市场规模有望达万亿元量级
- U盘安装系统时蓝屏怎么解决 全球头条
- ROG蓝屏后该采取什么解决方法来重启 世界快报
- 中国地震局:国家地震烈度速报与预警工程已完成主体建设任务 焦点讯息
- win10启动就蓝屏是怎么回事 全球热点
- 环球头条:华硕笔记本acpi蓝屏该如何解决
- 世界最资讯丨打击违规销售作弊器材行为 海南省市场监管部门多措并举为高考中考保驾护航
- 每日热议!永劫无间蓝屏死机应该如何处理
- KMODE蓝屏出现应该如何处理 全球观热点
- 携程集团发布2023年第一季度财报
- 甘肃省华亭市东华镇市场监管所开展农村夏季食品安全专项检查_环球热资讯
- 深圳市市场监管局总部经济审批服务“全市通办”正式落地
- 解码开化(一) 文旅产业:从“高看一眼”“棋高一招”到“焕然一新”
- 第五届京津冀石墨烯大会在北京房山举办,加速三地产业链深度融合
- 高考期间海南天气如何?未来两天多云有雷阵雨 焦点速读
- 别被“蚊蝇通杀”迷了眼
- 啥是海洋?直播带你一起看 天天快看点
- 内罗毕:低碳和电动交通载具展 天天观速讯
- 环球播报:斯诺克新星赵心童为涉赌遭禁赛道歉
- 《沙石镇时光》:1.0版本发售日期公布!通过“塑造你的未来”预告片为前方的秘密和危险做好准备 世界独家
- 关注眼健康亟须全社会行动起来
- 哈利波特魔法觉醒怎么尊享眉色 尊享眉色方法攻略 环球速看
- 甘肃省华亭市市场监管局多举措保障中高考期间食品安全 环球新动态
- 第19届深圳文博会人气旺 每日快报
- 甘肃省嘉峪关市市场监管局镜铁分局全力保障高考期间食品和特种设备安全
- 河北沙河:太行古村落焕发新活力_天天快播
- 世界百事通!晋陕峡谷遇奇石
- “共建首都跨境电商新生态”系列活动在京启动 每日热门
- 环球看热讯:汉字工坊上班不带饭怎么过 找出9个公司吃的答案分享
- 甘肃省张掖市新墩市场监管所“三力齐发”加强中高考期间特种设备安全保障_环球热推荐
- 快消息!小心,这种眼疾易盯上上班族
- 眼药水怎样使用才正确
- 当前讯息:机器人:公司基本实现了35kg以下新款机器人减速器的国产化替代
- 华菱钢铁:钢材产品在新能源新材料领域需求前景将持续向好-天天通讯
- 今早发布!雷雨!_天天即时
- 全球快报:云顶之弈s9暗影岛格温阵容攻略 s9赛季暗影岛格温阵容搭配
- 江苏“智造”夯牢实体经济“家底”
- 加拿大野火烟尘飘至美国 部分地区被烟尘笼罩
- 【环球时快讯】文字玩出花无法原谅怎么过 无法原谅十二处细思极恐在哪
- 环球快播:百亿授信!民生银行与协鑫集团达成全面战略合作
- 前5月外贸保持稳定增长 制造业转型升级塑造出口新动能
- 简讯:江苏油田页岩油累产突破4万吨
- 让城市成为“开放的艺术馆”(金台随笔) 视点
- 易会满:适时出台资本市场进一步支持高水平自立自强的政策措施 全球报道
- 【全球聚看点】河南麦收进度过八成 夏播已完成近五成
- 今起,在锡启幕!
- 两大国际组织上调中国2023年经济增长预期
- 仲景食品:公司产品以国内销售为主 出口业务占比较小-每日速看
- 天天速递!U盘装系统进入PE蓝屏该采取什么解决方法
- 充满算计!日美澳在南太铺光缆,日媒炒“抗衡中国影响力” 焦点热门
- 重点聚焦!力箭一号火箭的专属发射工位长什么样?
- 袁明辉:拍摄下来记录下来用自然摄影留住那些美好
- 扫码支付已在国内迅速发展普及 刷掌支付是否还有市场前景
- “去风险”成脱钩新马甲
- 环球微资讯!360qpesv.sys导致蓝屏该采取什么解决方法
- 【新要闻】北海市海城区地角街道辖区率先完成第二季度食品安全“两个责任”包保工作
- 国家开发银行前5个月发放交通领域贷款2687亿元
- 当前视点!带火原料药企,马斯克加持的“减肥神药”又火了
- 什么是股份制企业?股份制企业和私营企业的区别有哪些?
- 怎么才能正确安装python39.dll
- 全球连线|对两国合作机遇充满期待——洪都拉斯各界热议中国驻洪使馆开馆
- 兰州新区召开第二季度落实食品安全“两个责任”推进会议
- 民泰银行绍兴分行创新产品助共富系列① | 动产融资业务,为民播下“共富”希望-世界实时
- 【世界快播报】我国外贸连续4个月保持正增长
- 偷渡罪一般判多少年?偷渡人员怎么正规回国?
- 吉利雷达以“真乘用化”撬动市场,5月销售1016台创历史新高 焦点资讯
- 故意伤害致人死亡如何处罚?故意伤害致死赔偿多少?
- “6·6”全国爱眼日公益讲座在京举办
- 上古诸神:卡牌对战官网在哪下载 最新官方下载安装地址 环球热推荐
- 天天头条:电脑中缺失alrsvc.dll文件应该怎么处理
- 赡养费标准是什么?不给赡养费最严重的后果有哪些?
- 只允许跟院方合作民营救护车辆进入?医院回应
- 涉案金额959万元!海口曝光9家定点医疗机构
- 世界快播:如何解决电脑端丢失rasmans.dll提示问题
- 微资讯!江西省新余市市场监管局:强化建材质量监管 守牢质量安全防线
- 【快播报】警惕“负首付”骗贷
- 财产税有哪些税种?所得税和财产税的区别有哪些?
- 高考第二天部分地区已公布查分时间 胜利在望,加油少年!|全球快看点
- 青海省海西州四项措施为“中高考”保驾护航_每日看点
- 嫖娼拘留多少天?初次涉黄拘留几天?
- 青海省市场监管局发布中高考期间食品安全消费提示 天天热门
- 浙江金华婺城区:天然富硒,“硒”望之旅
- mtfutils.dll缺失如何恢复
- 忘了车限号开了一天罚多少钱?郑州限行免罚有几次机会?
- 焦点快播:网红化妆大师官网在哪下载 最新官方下载安装地址
- 动态:量子密钥分发攻防研究获重要进展