在元宇宙、5G等趨勢下,科技公司的算力需求還會指數(shù)級上升,這意味著巨量的能源消耗。在本期「談碳」里,何征宇針對螞蟻集團的“技術(shù)
減排”構(gòu)想、落地、以及商業(yè)化前景,分享了這幾年的故事和經(jīng)驗。
和大多互聯(lián)網(wǎng)科技公司相似,“雙碳”大潮來臨時,螞蟻集團面臨這樣一道考題:自身業(yè)務(wù)沒什么高額
碳排放,想減碳的話,從哪減?怎么減?
何征宇就接到了這道命題。
何征宇有著標(biāo)準(zhǔn)學(xué)霸模板的履歷:15 歲考取
北京理工大學(xué),博士畢業(yè)于佐治亞理工學(xué)院,后供職于谷歌內(nèi)核組,創(chuàng)立并帶領(lǐng)開源項目 gVisor ,成為基礎(chǔ)技術(shù)領(lǐng)域里的新星。
2018 年,何征宇回國加入螞蟻集團,第一項工作就是螞蟻集團技術(shù)架構(gòu)升級項目。他帶頭建立起的“可信原生技術(shù)部”,專攻基礎(chǔ)設(shè)施技術(shù),其中第一個目標(biāo)就是通過技術(shù)架構(gòu)的升級,更合理的分配計算資源,提升螞蟻基礎(chǔ)設(shè)施的整體運行效率。
到了 2020 年,國家宣布“碳達峰、
碳中和”目標(biāo),包括何征宇團隊在內(nèi)的螞蟻集團“綠色計算”相關(guān)團隊,將 2019 年至今的工作更完整梳理了一遍,從而確定了碳中和行動路線。如今,何征宇任職螞蟻集團可信原生事業(yè)部總裁、螞蟻集團基礎(chǔ)設(shè)施委員會主席。
用 IT 的手段
節(jié)能降碳,業(yè)內(nèi)已有先例。“綠色計算”就是業(yè)界基于這一
問題提出的新概念。雖尚無明確定義,但業(yè)界普遍認為,綠色計算的核心就是提高資源利用效率。
在具體實踐上,綠色計算主要分為兩個方面:在物理層面,降低數(shù)據(jù)中心 PUE(核心能耗指標(biāo),即數(shù)據(jù)中心總能耗/ IT 設(shè)備能耗);在算力層面,合理分配計算資源。
何征宇麾下的可信原生技術(shù)部中多項自研技術(shù),就和數(shù)據(jù)庫、技術(shù)風(fēng)險部門的研究成果一起,被歸集到“綠色計算”體系中。2021 年雙十一期間,“綠色計算技術(shù)體系”首次大規(guī)模應(yīng)用在阿里巴巴電商業(yè)務(wù)中——螞蟻的計算資源會變成“潮汐車道”,計算資源按時間段分配給不同的任務(wù)。比如,中午飯點是閑時,計算資源可以分配給實時性要求不高的操作;但在晚上零點,計算資源就可以全力支援付款下單高峰期,資源騰挪的時間可從原來的幾個小時降到一分鐘左右。
一份計算資源在不同時間段提供給不同的操作任務(wù),極大提高計算資源利用效率。去年一場雙十一下來,綠色計算讓螞蟻節(jié)省了 64 萬度電,相當(dāng)于 820 個人的全年生活用電;減排二氧化碳 394 噸,相當(dāng)于 3 萬輛燃油車停開一天。
2021年螞蟻集團雙11減排報告
而同比三年前,螞蟻集團的服務(wù)器利用率提高超過 2 倍,相當(dāng)于同等規(guī)模業(yè)務(wù)下,每一份算力的耗電量減少了一半。
能在短時間內(nèi)達到這樣的減排效果,螞蟻 2019 年架構(gòu)升級的每一步,都不可缺少。
“過去三年,螞蟻的技術(shù)架構(gòu)升級主要做了兩件事,首先是將業(yè)務(wù)搬到云原生架構(gòu)上;第二是建立了統(tǒng)一的調(diào)度中心,用來調(diào)度所有計算資源。”何征宇對 36 碳回憶。
此前,螞蟻已完成業(yè)務(wù)上云,首先滿足的是讓業(yè)務(wù)軟件搬到云上,在云上“可用”。等到業(yè)務(wù)進入高速發(fā)展階段,內(nèi)部的計算資源分散在不同地方,比如業(yè)務(wù)、AI 等算力需求較大的部門都擁有自己的技術(shù)棧,重復(fù)造輪子的問題日益明顯。
所以,選擇升級到云原生架構(gòu),相當(dāng)于將底層的操作環(huán)境推倒重來,基于云進行重構(gòu)系統(tǒng),保證安全可信。開發(fā)人員不用再像以前一樣,將軟件開發(fā)好了再部署到云上,而是從研發(fā)開始就直接在云上協(xié)作。
在此基礎(chǔ)上,可信原生技術(shù)部研發(fā)的核心技術(shù),讓計算效率顯著提高。螞蟻自研的安全容器技術(shù),就類似于讓來自安卓和 IOS 終端的計算任務(wù),同時存在于同一個環(huán)境里,隔離好,讓兩個任務(wù)獨立運行。即使 CPU 負載超過 95% ,計算效率也很少受到影響。
技術(shù)減排背后,螞蟻集團的組織機制和調(diào)整也提供了保障。
從組織機制上,每一年,螞蟻集團內(nèi)部首先通過財務(wù)原則來管控,每年都根據(jù)上一年的資源實際使用情況來制定當(dāng)年的預(yù)算。之后,業(yè)務(wù)和技術(shù)再根據(jù)需求,確定今年的技術(shù)投入和減排目標(biāo)。
通過升級云原生架構(gòu),螞蟻也將算力的分配統(tǒng)一歸到了 CTO 線,并且成立了類似可信原生技術(shù)部這樣的部門,攻堅相關(guān)的基礎(chǔ)設(shè)施技術(shù)。
“以前,一些算力需求比較大的部門會擁有自己的技術(shù)棧和服務(wù)器,這就肯定容易有資源閑置。云原生化后,螞蟻將算力統(tǒng)一歸到 CTO 線進行調(diào)配,技術(shù)上減少了很多損耗,才有可能做到綠色計算。”何征宇告訴36 碳。
放眼碳中和進程,如今距離國家宣布“雙碳”目標(biāo)不過短短一年多,科技巨頭們的“減碳路”,剛剛開始。
“雙碳”目標(biāo)被提出后,騰訊在今年 2 月發(fā)布碳中和目標(biāo)和行動路線,明確第一階段的任務(wù):在節(jié)能同時,加大綠電應(yīng)用,以自研、投資的方式探索新技術(shù)路線和商業(yè)模式。華為則基于原有的 ICT 業(yè)務(wù),在去年 6 月成立了“華為數(shù)字能源”,目前已經(jīng)對外輸出自家的綠色數(shù)據(jù)中心、基站等方案。
2021 年 3 月,螞蟻公布了碳中和目標(biāo),承諾于 2030 年實現(xiàn)凈零排放(范圍一、二、三),并在 4 月公布了自家碳中和路線。
從路徑上看,除了主流的降低數(shù)據(jù)中心 PUE 、采購綠電、投資綠色技術(shù)、
碳匯抵消等手段,螞蟻的碳中和排放路徑更注重技術(shù)減排帶來的效益——螞蟻在今年的碳中和報告中,就特意提及了,綠色計算在 2021 年為螞蟻減少了近 3 萬噸碳。
目前,螞蟻的綠色計算技術(shù)也在通過開源、免費開放專利、論文分享多種形式共享。其中具有彈性可伸縮能力的分布式數(shù)據(jù)庫,先行一步走到商業(yè)化階段—— OceanBase 數(shù)據(jù)庫開始商業(yè)化,幫助有相應(yīng)需求的客戶達到增效節(jié)電的的效果。現(xiàn)在,OceanBase 已經(jīng)服務(wù)超過 400 個客戶。
可做的事情還有很多。何征宇表示,螞蟻的目標(biāo),是要在 3 - 5 年內(nèi)追上世界一流的減排實踐。
國外科技巨頭做碳中和都更早。谷歌早在 2007 年就宣布自身實現(xiàn)碳中和,此后陸續(xù)推出包括自研數(shù)據(jù)中心、Nest 恒溫器節(jié)能電源等產(chǎn)品;在技術(shù)架構(gòu)上,谷歌從存儲到計算形成一體化底座,也讓能耗大大減少。
到了 2021 年,谷歌甚至在凈零排放的目標(biāo)基礎(chǔ)上更進一步做出承諾:到 2030 年,讓數(shù)據(jù)中心“全天候使用無碳能源運營”, 這意味著運行的全生命周期里都需要采用綠色能源。
對于 3 - 5 年的目標(biāo),何征宇表示,螞蟻主要押注在基礎(chǔ)軟件技術(shù)突破上。他認為,技術(shù)在綠色計算發(fā)揮的潛力遠未被充分挖掘。
一個證明是,當(dāng)前數(shù)據(jù)中心 PUE 降低快到達極限值,減排空間已經(jīng)不太大;但通過計算資源合理調(diào)度,螞蟻的資源利用率跟三年前比提升了兩倍多,今年預(yù)期漲幅也相當(dāng)可觀。何征宇認為,技術(shù)減排的紅利仍有很多,而基礎(chǔ)技術(shù)研發(fā)普遍存在后發(fā)優(yōu)勢,接下來團隊解決問題的速度會越來越快。
接下來,可信原生技術(shù)部的觸角也在不斷延展到新的領(lǐng)域——在今年,何征宇團隊將會重點攻堅如存儲資源池化的問題。“現(xiàn)在我們是將上層的算力做調(diào)度,但存儲是更為底層、更難遷移的。一旦將計算和存儲打通,業(yè)務(wù)操作效率將會有質(zhì)的提升,這也會進一步減少能源消耗。我們今年的目標(biāo),是將資源利用率再提升15% 左右。”他對 36 碳表示。
以下為 36 碳與螞蟻集團可信原生事業(yè)部總裁、螞蟻集團基礎(chǔ)設(shè)施委員會主席何征宇的對話內(nèi)容,經(jīng)編輯后發(fā)布: