智算中心作為新興的算力基礎(chǔ)設(shè)施,正逐漸成為推動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展的重要力量,亦成為新建數(shù)據(jù)中心的“標(biāo)配”。根據(jù)《中國綜合算力指數(shù)(2024年)》數(shù)據(jù),截至2024年6月,我國在用算力中心超過830萬標(biāo)準(zhǔn)機(jī)架,算力總規(guī)模246EFLOPS(FP32)。智能算力規(guī)模76EFLOPS,智算同比增速超過65%。
對(duì)于很多IDC企業(yè)來說,智算已經(jīng)成為必選項(xiàng)。但智算中心高昂的建設(shè)成本成為了制約傳統(tǒng)IDC向智算轉(zhuǎn)型的關(guān)鍵因素。那么,從TCO(總體擁有成本)的角度,IDC企業(yè)該如何跨越成本門檻,擁抱未來呢?
從“硬”到“軟”的成本考驗(yàn)
智算中心的高成本眾所周知,其中最大的一部分就是服務(wù)器成本。相比于傳統(tǒng)數(shù)據(jù)中心,這些配備了GPU或者智算芯片等異構(gòu)芯片的設(shè)備價(jià)格往往高出數(shù)倍,甚至數(shù)十倍。一臺(tái)配置了8塊GPU的智算服務(wù)器,其價(jià)格可能高達(dá)200萬甚至300萬元人民幣以上,這還不包括與之配套的存儲(chǔ)、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施。
由于智算單元之間高速數(shù)據(jù)傳輸及低延遲通信的互聯(lián)需求,智算中心需要部署先進(jìn)的網(wǎng)絡(luò)架構(gòu),如InfiniBand或RoCE等,這也是一筆不小的開銷。此外,隨著模型參數(shù)規(guī)模的增長,組網(wǎng)規(guī)模擴(kuò)大帶來的管理挑戰(zhàn)同樣需要額外的投資來解決。
智算中心的能耗和運(yùn)維成本也是不容忽視的。由于使用了大量的高性能計(jì)算單元,智算中心的能耗遠(yuǎn)高于通用數(shù)據(jù)中心。一些智算中心的單機(jī)柜功率密度甚至達(dá)到了100kW以上,這意味著它們需要更強(qiáng)大的供電能力和成本更高的制冷系統(tǒng)——比如液冷來支持運(yùn)行。
除了硬件投資外,維護(hù)大規(guī)模并行計(jì)算環(huán)境下的穩(wěn)定性與效率需要專業(yè)的技術(shù)支持團(tuán)隊(duì),并且隨著軟件棧變得越來越復(fù)雜,自動(dòng)化運(yùn)維工具的重要性日益凸顯。如果提供更深層次的智算服務(wù)還需要部署商業(yè)軟件等……由此帶來的人才、軟件成本都不容忽視。
價(jià)值創(chuàng)造:長期視角下的TCO考量
面對(duì)高昂的成本,不少從業(yè)者和用戶對(duì)智算中心的投資回報(bào)深深抱有疑慮。然而,從長遠(yuǎn)來看,智算中心的業(yè)務(wù)前景廣闊,其所帶來的價(jià)值創(chuàng)造潛力是巨大的。因此,從TCO角度出發(fā),如何優(yōu)化運(yùn)維能力,進(jìn)行技術(shù)創(chuàng)新,從而降低TCO,獲得更高的生產(chǎn)力和市場(chǎng)競(jìng)爭(zhēng)力,是算力企業(yè)更應(yīng)該考慮的問題。
智算中心如何跨越成本門檻
運(yùn)維優(yōu)化是降低智算中心TCO的最直接手段之一。一方面通過智能監(jiān)控和預(yù)警系統(tǒng)來及時(shí)發(fā)現(xiàn)和解決潛在問題,避免故障發(fā)生導(dǎo)致的損失。一方面可以通過智能運(yùn)維微調(diào)整體運(yùn)行環(huán)境,降低整體能耗,在長期的運(yùn)行中實(shí)現(xiàn)成本的節(jié)約。
技術(shù)創(chuàng)新則是降低智算中心TCO的根本途徑。通過研發(fā)更為高效、節(jié)能的硬件設(shè)備和算法,企業(yè)可以在保證性能的同時(shí),有效降低硬件和能耗成本。比如通過優(yōu)化硬件設(shè)計(jì)、提高集成度等方式來提高硬件的性能和能效比;嘗試更高效的算法來加速AI應(yīng)用,降低算力成本等。
從發(fā)展角度看,智算中心的成本問題最終還要依賴于生態(tài)建設(shè)的完善。特別是在國產(chǎn)智算生態(tài)中,可以嘗試使用國產(chǎn)芯片等替代方案來降低成本。同時(shí),積極推動(dòng)制定統(tǒng)一的技術(shù)標(biāo)準(zhǔn)和規(guī)范,降低不同品牌產(chǎn)品的集成度,提升穩(wěn)定性,進(jìn)一步降低集成成本。
隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,智算中心有望在推動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展和產(chǎn)業(yè)升級(jí)方面發(fā)揮更為重要的作用。如何更好的發(fā)展智算生態(tài),也將成為算力產(chǎn)業(yè)發(fā)展繞不開的話題。
中國IDC產(chǎn)業(yè)年度大典組委會(huì)將于2024年12月19日-20日在北京隆重舉辦第十九屆中國IDC產(chǎn)業(yè)年度大典(IDCC2024)。大會(huì)聚焦“智算崛起”“賦能協(xié)同”“環(huán)球布局”“誰主沉浮”“算力新十年”幾大議題模塊,旨在探討算力產(chǎn)業(yè)的未來發(fā)展方向、技術(shù)創(chuàng)新、商業(yè)模式變革以及可持續(xù)發(fā)展路徑。攜手算力產(chǎn)業(yè)精英,共同推動(dòng)中國乃至全球數(shù)字經(jīng)濟(jì)的繁榮與發(fā)展。目前報(bào)名通道已開啟,掃描以下二維碼即可報(bào)名。
“多元重構(gòu) 算力躍遷” 第十九屆中國IDC產(chǎn)業(yè)年度大典 報(bào)名二維碼