【摘要】伴隨經(jīng)濟(jì)社會(huì)數(shù)字化轉(zhuǎn)型加速,以及各類數(shù)字應(yīng)用場(chǎng)景的涌現(xiàn),算力的重要性不斷凸顯,已成為各國(guó)提高綜合國(guó)力和國(guó)際影響力的戰(zhàn)略制高點(diǎn)。在人工智能技術(shù)的深化發(fā)展期,需以充足且均衡的算力作為基石,支撐算法創(chuàng)新與硬件迭代,充分釋放數(shù)據(jù)要素活力,將政策紅利轉(zhuǎn)變?yōu)楫a(chǎn)業(yè)發(fā)展紅利。我國(guó)算力產(chǎn)業(yè)自20世紀(jì)70年代以來(lái)歷經(jīng)四個(gè)發(fā)展階段,算力規(guī)模穩(wěn)步提升,算力賦能日益深化。但不容忽視,我國(guó)算力發(fā)展仍然面臨產(chǎn)品滲透率不高、超大集群能效設(shè)計(jì)不足、大規(guī)模算力互聯(lián)與管理經(jīng)驗(yàn)缺乏等現(xiàn)實(shí)挑戰(zhàn)。為此,應(yīng)著力強(qiáng)化基礎(chǔ)硬件自主創(chuàng)新與產(chǎn)業(yè)支撐,加快前沿技術(shù)布局與架構(gòu)創(chuàng)新,完善數(shù)據(jù)流動(dòng)的軟硬性實(shí)力,優(yōu)化數(shù)字能源發(fā)展,實(shí)現(xiàn)我國(guó)算力產(chǎn)業(yè)超大集群協(xié)同發(fā)展。
【關(guān)鍵詞】科技競(jìng)爭(zhēng) 國(guó)產(chǎn)算力產(chǎn)業(yè) 算力使用效率 超大集群互聯(lián)
【中圖分類號(hào)】D92 【文獻(xiàn)標(biāo)識(shí)碼】A
“十五五”規(guī)劃建議指出:“加快人工智能等數(shù)智技術(shù)創(chuàng)新,突破基礎(chǔ)理論和核心技術(shù),強(qiáng)化算力、算法、數(shù)據(jù)等高效供給。”①算力,是集信息計(jì)算力、網(wǎng)絡(luò)運(yùn)載力、數(shù)據(jù)存儲(chǔ)力于一體的新質(zhì)生產(chǎn)力,主要通過(guò)算力基礎(chǔ)設(shè)施向社會(huì)提供服務(wù)。當(dāng)前,伴隨數(shù)字化轉(zhuǎn)型加速以及各類數(shù)字應(yīng)用場(chǎng)景的涌現(xiàn),算力的重要性不斷凸顯,成為激活數(shù)據(jù)要素潛能、推動(dòng)科技創(chuàng)新、助推產(chǎn)業(yè)轉(zhuǎn)型升級(jí)、引領(lǐng)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的新質(zhì)生產(chǎn)力,并成為各國(guó)提高綜合國(guó)力和國(guó)際影響力的戰(zhàn)略制高點(diǎn)②。
在以數(shù)據(jù)、算法、算力為三大驅(qū)動(dòng)引擎的數(shù)字經(jīng)濟(jì)時(shí)代,算力作為新質(zhì)生產(chǎn)力,是互聯(lián)網(wǎng)、政務(wù)、工業(yè)、金融、醫(yī)療、交通、能源、教育等各個(gè)行業(yè)智能設(shè)備運(yùn)行的核心支撐要素。按照應(yīng)用場(chǎng)景劃分,算力一般可分為通用算力(GPC)與高性能算力(HPC)。近年來(lái),高性能計(jì)算解決方案的普及度顯著提升,強(qiáng)大的計(jì)算能力使其在教育機(jī)構(gòu)、政府組織、能源部門及國(guó)防組織等領(lǐng)域得到廣泛應(yīng)用。伴隨算力網(wǎng)與電力網(wǎng)的競(jìng)合發(fā)展,全球算力競(jìng)爭(zhēng)已經(jīng)由常規(guī)的算力規(guī)模、算力模型延伸至算力能源供給技術(shù)領(lǐng)域,并日趨白熱化。
在產(chǎn)業(yè)層面,算力產(chǎn)業(yè)鏈涵蓋由基礎(chǔ)硬件、基礎(chǔ)軟件、基礎(chǔ)設(shè)施構(gòu)成的上游產(chǎn)業(yè);由第三方數(shù)據(jù)中心、云計(jì)算服務(wù)、網(wǎng)絡(luò)運(yùn)營(yíng)服務(wù)、IT外包服務(wù)、系統(tǒng)集成服務(wù)構(gòu)成的中游產(chǎn)業(yè);以及由互聯(lián)網(wǎng)、工業(yè)、金融、能源等各行業(yè)企業(yè)用戶構(gòu)成的下游產(chǎn)業(yè)③。算力的提升直接依賴關(guān)鍵硬件組件的性能指標(biāo)。以個(gè)人計(jì)算機(jī)系統(tǒng)為例,其中央處理器(CPU)的主頻與核心數(shù)量、圖形處理單元(GPU)的并行計(jì)算能力,以及隨機(jī)存取存儲(chǔ)器(RAM)的容量與帶寬等參數(shù),共同決定系統(tǒng)的整體計(jì)算效能。這些硬件規(guī)格的優(yōu)化升級(jí)能夠顯著提升設(shè)備運(yùn)算速度、數(shù)據(jù)處理能力和多任務(wù)處理效率,進(jìn)而為用戶提供更優(yōu)質(zhì)的計(jì)算體驗(yàn)。我國(guó)國(guó)產(chǎn)算力產(chǎn)業(yè)起步晚、發(fā)展勁頭強(qiáng)、科技創(chuàng)新前景好,已實(shí)現(xiàn)通算、智算、超算多元算力的協(xié)同發(fā)展,算力規(guī)模穩(wěn)步提升,算力賦能日益深化,但仍需破解核心技術(shù)與產(chǎn)品外部依賴度高、互聯(lián)生態(tài)不完善、高性能計(jì)算應(yīng)用場(chǎng)景與市場(chǎng)需求不匹配等難題。
自20世紀(jì)70年代以來(lái),我國(guó)算力產(chǎn)業(yè)發(fā)展歷經(jīng)四個(gè)階段
中國(guó)算力產(chǎn)業(yè)的發(fā)展歷程,不僅是我國(guó)科技實(shí)力提升的重要縮影,更是產(chǎn)業(yè)變革帶動(dòng)經(jīng)濟(jì)社會(huì)發(fā)展的生動(dòng)寫照,充分展示我國(guó)技術(shù)轉(zhuǎn)移體系、產(chǎn)學(xué)研用一體化、企業(yè)科技創(chuàng)新動(dòng)能釋放的階段性成就。按階段劃分,中國(guó)國(guó)產(chǎn)算力經(jīng)歷了從起步探索到自主創(chuàng)新、從依賴進(jìn)口到全球領(lǐng)先的跨越式發(fā)展。
第一階段為技術(shù)起步階段:可溯源至上世紀(jì)70—90年代,主要通過(guò)研制超級(jí)計(jì)算機(jī)與基礎(chǔ)技術(shù)探索進(jìn)行技術(shù)積累與基礎(chǔ)布局。現(xiàn)代算法技術(shù)的起源可追溯至二戰(zhàn)時(shí)期,其發(fā)展深受軍事計(jì)算需求,如彈道軌跡計(jì)算與密碼破譯的推動(dòng)。至1964年,美國(guó)成功研制用于核武器設(shè)計(jì)與天氣模擬的超級(jí)計(jì)算機(jī),標(biāo)志著該技術(shù)進(jìn)入了成形與發(fā)展階段。1983年,中國(guó)首臺(tái)億次超級(jí)計(jì)算機(jī)“銀河-I”問(wèn)世,打破西方技術(shù)封鎖并開(kāi)啟自主超算研發(fā)之路。1992年,“銀河-II”突破百億次運(yùn)算,應(yīng)用于氣象預(yù)報(bào)和石油勘探,初步展現(xiàn)算力對(duì)國(guó)家的重要戰(zhàn)略價(jià)值。雖然彼時(shí)芯片、操作系統(tǒng)等核心技術(shù)仍依賴進(jìn)口,但中國(guó)通過(guò)“863計(jì)劃”等政策支持逐步建立起自己的研發(fā)體系。
第二階段為技術(shù)追趕階段:2000年—2010年期間,美國(guó)已將互聯(lián)網(wǎng)向民用開(kāi)放。摩爾定律的加持下,CPU、內(nèi)存、硬盤等部件性能高速提升,英特爾、微軟、SUN等主流科技公司聯(lián)合開(kāi)發(fā)Next Generation I/O(NGIO)技術(shù)標(biāo)準(zhǔn);IBM、康柏、惠普則主導(dǎo)開(kāi)發(fā)合并Future I/O(FIO)技術(shù)標(biāo)準(zhǔn),并創(chuàng)立英飛凌貿(mào)易協(xié)會(huì)(InfiniBand Trade Association,IBTA)與服務(wù)器I/O架構(gòu)規(guī)范1.0。這一時(shí)期,中國(guó)超算技術(shù)攻堅(jiān)克難并在科技實(shí)力層面實(shí)現(xiàn)突破,躋身全球前列。2004年,曙光4000A以世界第十的排名成為首個(gè)進(jìn)入全球TOP500榜單的中國(guó)超算。2010年,“天河一號(hào)”以千萬(wàn)億次算力(P級(jí))問(wèn)鼎世界第一,標(biāo)志中國(guó)進(jìn)入超算第一梯隊(duì),載人航天、基因測(cè)序等超算算力的重要應(yīng)用場(chǎng)景亦得到拓展,如“天宮一號(hào)”軌道計(jì)算、高鐵空氣動(dòng)力學(xué)模擬等重大工程均離不開(kāi)超算發(fā)展。此外,伴隨超算發(fā)展,國(guó)內(nèi)芯片、操作系統(tǒng)、服務(wù)器等領(lǐng)域開(kāi)始涌現(xiàn)一大批信息技術(shù)企業(yè),進(jìn)一步為中國(guó)信創(chuàng)產(chǎn)業(yè)發(fā)展與國(guó)民經(jīng)濟(jì)騰飛奠定基礎(chǔ)。
第三階段為自主創(chuàng)新階段:2010年,美國(guó)IBTA貿(mào)易協(xié)會(huì)對(duì)以太網(wǎng)算法進(jìn)行技術(shù)創(chuàng)新,2015年至2020年,美國(guó)InfiniBand已經(jīng)成為超級(jí)計(jì)算機(jī)的首選內(nèi)部鏈接技術(shù),其業(yè)務(wù)范圍逐步從芯片延伸到網(wǎng)卡、交換機(jī)、遠(yuǎn)程通信系統(tǒng)與線纜模塊等領(lǐng)域,確立世界級(jí)網(wǎng)絡(luò)提供商的地位。在此期間,中國(guó)國(guó)產(chǎn)算力主要著力于核心技術(shù)突破與技術(shù)生態(tài)構(gòu)建,并于2016年取得芯片自主化的重大突破,即搭載國(guó)產(chǎn)“申威26010”處理器的“神威·太湖之光”超算以93PFlops的算力再奪世界第一,并實(shí)現(xiàn)核心芯片完全自主可控。產(chǎn)學(xué)研領(lǐng)域,用于訓(xùn)練人工智能系統(tǒng)的算力需求呈爆炸式增長(zhǎng),計(jì)算性能的高速提升成為人工智能突破性發(fā)展與規(guī)模化投資的主要催化劑,中美算力競(jìng)爭(zhēng)同步加?、?。2017年,國(guó)家發(fā)布《新一代人工智能發(fā)展規(guī)劃》,明確將算力列為人工智能發(fā)展的核心基礎(chǔ)設(shè)施。2020年,“新基建”戰(zhàn)略將數(shù)據(jù)中心、智能計(jì)算中心納入國(guó)家基礎(chǔ)設(shè)施,進(jìn)一步加速全國(guó)算力網(wǎng)絡(luò)布局。當(dāng)前,用于訓(xùn)練人工智能系統(tǒng)的算力大約每六個(gè)月翻一番。云計(jì)算與人工智能算力的崛起,推動(dòng)許多企業(yè)對(duì)主機(jī)托管基礎(chǔ)設(shè)施與公有云服務(wù)進(jìn)行大量投資。阿里云、華為云等企業(yè)積極推動(dòng)云計(jì)算普及,寒武紀(jì)、昇騰等人工智能芯片發(fā)展亦呈現(xiàn)加速。
第四階段為技術(shù)引領(lǐng)階段:2020年以來(lái),中國(guó)國(guó)產(chǎn)算力產(chǎn)業(yè)已躋身全球前列,多元化算力體系與戰(zhàn)略性算力布局全球領(lǐng)先。2022年,“東數(shù)西算”工程啟動(dòng),國(guó)家樞紐節(jié)點(diǎn)實(shí)現(xiàn)布局優(yōu)化,東西部算力資源分配在降低能耗的同時(shí)效率提升⑤。截至2024年底,我國(guó)算力總規(guī)模達(dá)280EFLOPS(每秒百億億次浮點(diǎn)運(yùn)算),其中智能算力規(guī)模達(dá)90EFLOPS,占比32%。同時(shí),量子計(jì)算等前沿技術(shù)實(shí)現(xiàn)突破,“九章”光量子計(jì)算機(jī)實(shí)現(xiàn)“量子優(yōu)越性”,“祖沖之號(hào)”超導(dǎo)量子芯片在量子比特規(guī)模和相干時(shí)間等方面取得突破,融合CPU、GPU、NPU的多元算力架構(gòu)亦推動(dòng)異構(gòu)計(jì)算,支撐自動(dòng)駕駛、元宇宙等新興場(chǎng)景落地。此外,算力平臺(tái)的綠色低碳轉(zhuǎn)型使數(shù)據(jù)中心電能利用效率(PUE)值從1.5降至1.3以下,液冷技術(shù)、可再生能源應(yīng)用推動(dòng)算力產(chǎn)業(yè)的可持續(xù)發(fā)展。
我國(guó)算力產(chǎn)業(yè)發(fā)展現(xiàn)狀與增長(zhǎng)趨勢(shì)
在國(guó)家戰(zhàn)略的強(qiáng)力牽引和市場(chǎng)需求的驅(qū)動(dòng)下,我國(guó)算力產(chǎn)業(yè)已步入規(guī)?;Ⅲw系化的高質(zhì)量發(fā)展新階段。同時(shí),伴隨人工智能與機(jī)器學(xué)習(xí)技術(shù)的高速發(fā)展,全球算力需求持續(xù)增長(zhǎng),這一趨勢(shì)推動(dòng)了我國(guó)算力市場(chǎng)擴(kuò)張,在為相關(guān)行業(yè)帶來(lái)較大經(jīng)濟(jì)收益的同時(shí),也極易引發(fā)算力壟斷等問(wèn)題。當(dāng)前,我國(guó)算力產(chǎn)業(yè)發(fā)展呈現(xiàn)出規(guī)模與結(jié)構(gòu)持續(xù)優(yōu)化、自主創(chuàng)新與融合應(yīng)用加速的鮮明特征,為我國(guó)數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。
? 我國(guó)算力產(chǎn)業(yè)發(fā)展現(xiàn)狀方面
其一,算力市場(chǎng)規(guī)模與應(yīng)用領(lǐng)域不斷拓展。當(dāng)前,服務(wù)器是算力產(chǎn)業(yè)的核心組成部分,數(shù)據(jù)中心和中小企業(yè)(SME)的算力需求旺盛;制造業(yè)等傳統(tǒng)行業(yè)通過(guò)部署高性能計(jì)算(HPC)系統(tǒng)和先進(jìn)設(shè)計(jì)軟件,生產(chǎn)效率與競(jìng)爭(zhēng)力顯著提升。其二,人工智能技術(shù)發(fā)展催生新興算力產(chǎn)業(yè)模式。特別是以DeepSeek為代表的大型預(yù)訓(xùn)練模型取得關(guān)鍵突破,顯著驅(qū)動(dòng)人工智能滲透到智能制造、金融風(fēng)控與智能交通等領(lǐng)域的深度融合,進(jìn)而催生新興的算力產(chǎn)業(yè)模式與經(jīng)濟(jì)增長(zhǎng)點(diǎn)。其三,政策支持與自主創(chuàng)新形成合力并展現(xiàn)強(qiáng)勁內(nèi)生動(dòng)能。宏觀政策引導(dǎo)下,數(shù)據(jù)中心和智能算力基礎(chǔ)設(shè)施建設(shè)全面提速,企業(yè)持續(xù)加大研發(fā)投入,推出契合市場(chǎng)需求的國(guó)產(chǎn)算力產(chǎn)品與解決方案,算力產(chǎn)業(yè)生態(tài)日趨完善。
? 我國(guó)算力產(chǎn)業(yè)未來(lái)增長(zhǎng)方面
我國(guó)算力技術(shù)體系正加速向自主化、可控化戰(zhàn)略轉(zhuǎn)型。面對(duì)日益復(fù)雜的國(guó)際環(huán)境與技術(shù)限制,我國(guó)算力產(chǎn)業(yè)的自主創(chuàng)新步伐正在全面提速。據(jù)摩根士丹利2025年發(fā)布的研究報(bào)告估算,中國(guó)人工智能GPU自給率已從2020年不足10%提升至2024年約34%,并有望在2027年升至約82%。在這一趨勢(shì)下,算力產(chǎn)業(yè)發(fā)展正從過(guò)去單點(diǎn)硬件的性能追趕,轉(zhuǎn)向更加務(wù)實(shí)、高效的系統(tǒng)級(jí)創(chuàng)新。例如,華為提出“用系統(tǒng)工程的思路,通過(guò)集群計(jì)算彌補(bǔ)單芯片性能不足”的策略,依托大規(guī)模部署昇騰系列國(guó)產(chǎn)芯片,結(jié)合自主研發(fā)高速互聯(lián)網(wǎng)絡(luò)、并行計(jì)算框架(如CANN)及優(yōu)化算法,在系統(tǒng)層面實(shí)現(xiàn)與國(guó)際頂尖水平相當(dāng)、甚至特定任務(wù)上更優(yōu)的運(yùn)算性能。未來(lái),除繼續(xù)支持芯片設(shè)計(jì)制造外,還需大力投入系統(tǒng)軟件、編譯器、互聯(lián)技術(shù)等國(guó)產(chǎn)“軟實(shí)力”建設(shè),充分釋放硬件潛力。
高質(zhì)量算力發(fā)展成為核心方向,產(chǎn)業(yè)重心從“規(guī)模擴(kuò)張”轉(zhuǎn)向“算效提升”。伴隨我國(guó)算力總規(guī)模邁上新臺(tái)階,“算效”(即算力利用效率)正被提升至戰(zhàn)略高度。中國(guó)信通院等機(jī)構(gòu)提出,衡量算力不應(yīng)只看理論峰值(EFLOPS),而應(yīng)綜合評(píng)估“高算效、高智效、高碳效”等維度指標(biāo)對(duì)應(yīng)的“高質(zhì)量算力”。當(dāng)前,算效低下是普遍存在的問(wèn)題,部分智算中心GPU實(shí)際利用率偏低,造成資源浪費(fèi)和供需結(jié)構(gòu)失衡。未來(lái),應(yīng)進(jìn)一步完善算力利用率、任務(wù)完成效率、單位能耗產(chǎn)出等實(shí)際效能指標(biāo),引導(dǎo)產(chǎn)業(yè)從粗放式規(guī)模競(jìng)賽轉(zhuǎn)向精細(xì)化效率競(jìng)爭(zhēng),從而整體提升國(guó)家算力基礎(chǔ)設(shè)施投資的戰(zhàn)略回報(bào)。
算力應(yīng)用持續(xù)向縱深拓展,賦能千行百業(yè)智能化轉(zhuǎn)型。當(dāng)前,算力正在從少數(shù)尖端領(lǐng)域的專用資源,加速轉(zhuǎn)變?yōu)槿珉娏Π愕钠栈菪曰A(chǔ)設(shè)施,深度融入經(jīng)濟(jì)社會(huì)各個(gè)方面。目前,全國(guó)已落地的算力應(yīng)用項(xiàng)目超過(guò)1.3萬(wàn)個(gè),建成的各級(jí)智能工廠超過(guò)3萬(wàn)家,并覆蓋工業(yè)、金融、交通、醫(yī)療、教育等重點(diǎn)行業(yè)。伴隨大模型技術(shù)的成熟及開(kāi)源普及,算力應(yīng)用門檻降低,正在為千行百業(yè)智能化轉(zhuǎn)型創(chuàng)造有利條件。未來(lái),需進(jìn)一步推動(dòng)大型云服務(wù)商和智算中心構(gòu)建開(kāi)放、易用的公共算力平臺(tái),并加快構(gòu)建面向特定行業(yè)的公共數(shù)據(jù)集和預(yù)訓(xùn)練模型,助力廣大中小企業(yè)快速開(kāi)發(fā)符合自身需求的智能化應(yīng)用。
國(guó)際競(jìng)爭(zhēng)與合作并存,標(biāo)準(zhǔn)與生態(tài)博弈日趨激烈。當(dāng)前,全球算力競(jìng)爭(zhēng)焦點(diǎn)日益集中于技術(shù)標(biāo)準(zhǔn)與產(chǎn)業(yè)生態(tài)構(gòu)建。例如,2024年成立的“超級(jí)以太網(wǎng)聯(lián)盟”(UEC)為下一代人工智能和高性能計(jì)算集群制定一套開(kāi)放統(tǒng)一的高速網(wǎng)絡(luò)標(biāo)準(zhǔn)。對(duì)我國(guó)而言,一方面,獨(dú)立于此類主流國(guó)際標(biāo)準(zhǔn)體系之外可能制造技術(shù)孤立與生態(tài)割裂的風(fēng)險(xiǎn),應(yīng)積極參與UEC等國(guó)際標(biāo)準(zhǔn)組織,推動(dòng)國(guó)內(nèi)標(biāo)準(zhǔn)與國(guó)際主流標(biāo)準(zhǔn)體系兼容互通;另一方面,我國(guó)主導(dǎo)、參與國(guó)產(chǎn)處理器架構(gòu)、操作系統(tǒng)、人工智能框架等產(chǎn)業(yè)技術(shù)標(biāo)準(zhǔn)建設(shè),也正迎來(lái)戰(zhàn)略窗口期,應(yīng)以更大決心投入構(gòu)建具備國(guó)際影響力的自主算力生態(tài)。
當(dāng)前我國(guó)國(guó)產(chǎn)算力高效供給面臨的主要難題
當(dāng)前,我國(guó)數(shù)字經(jīng)濟(jì)邁向全面擴(kuò)展期,數(shù)字化創(chuàng)新引領(lǐng)發(fā)展能力顯著增強(qiáng)。“十五五”規(guī)劃建議提出,深入推進(jìn)數(shù)字中國(guó)建設(shè),強(qiáng)化算力、算法、數(shù)據(jù)等高效供給。然而,當(dāng)前我國(guó)算力體系在一體化布局、區(qū)域協(xié)同、法規(guī)建設(shè)、算電協(xié)同及安全發(fā)展等方面仍存短板,疊加國(guó)際貿(mào)易摩擦與外部政策風(fēng)險(xiǎn),整體上我國(guó)算力產(chǎn)業(yè)發(fā)展亟待突破多重瓶頸。具體來(lái)看,高昂的算力、能源與硬件成本構(gòu)成初期投入壓力;技術(shù)整合難度高、數(shù)據(jù)標(biāo)準(zhǔn)化與共享機(jī)制不完善則形成軟性制約。
核心算力產(chǎn)品國(guó)產(chǎn)化率仍待提升。自從2021年信創(chuàng)項(xiàng)目落地以來(lái),國(guó)產(chǎn)服務(wù)器在政務(wù)等行業(yè)得到廣泛應(yīng)用,國(guó)產(chǎn)芯片及服務(wù)器性能持續(xù)迭代,正逐步由“可用”向“好用”邁進(jìn)。然而,國(guó)產(chǎn)化產(chǎn)品在核心領(lǐng)域的滲透率依然不足?!?024年中國(guó)國(guó)產(chǎn)服務(wù)器市場(chǎng)研究報(bào)告》指出,2024年國(guó)產(chǎn)服務(wù)器銷量超過(guò)90萬(wàn)臺(tái),但市場(chǎng)份額仍在20%左右,國(guó)產(chǎn)GPU在超算中心等諸多高端場(chǎng)景中利用率仍顯不足。未來(lái),要實(shí)現(xiàn)國(guó)產(chǎn)服務(wù)器在高端領(lǐng)域?qū)?guó)外產(chǎn)品的替代,必須同步突破芯片性能迭代與上游產(chǎn)能保障等關(guān)鍵環(huán)節(jié),以滿足“萬(wàn)卡”級(jí)算力集群的部署需求。
算力使用效率有待提升。在大模型分布式訓(xùn)練場(chǎng)景中,算力集群的“有效算力”提升相對(duì)有限。算力集群中,有效算力主要通過(guò)“GPU利用率”和“集群線性加速比”兩個(gè)指標(biāo)顯現(xiàn)。其中,前者受芯片架構(gòu)、內(nèi)存、互聯(lián)帶寬、芯片功耗等因素限制;后者則受節(jié)點(diǎn)間的通信能力、并行訓(xùn)練框架、資源調(diào)度等因素制約。這兩項(xiàng)指標(biāo)發(fā)揮得越充分,模型訓(xùn)練效率就越高、成本越低。面對(duì)未來(lái)超萬(wàn)卡規(guī)模的算力集群,需運(yùn)用系統(tǒng)工程方法,對(duì)集群網(wǎng)絡(luò)的精細(xì)化設(shè)計(jì),推動(dòng)軟硬件全棧整合優(yōu)化,綜合提升集群算力利用效率。
大規(guī)模算力互聯(lián)與管理存在挑戰(zhàn)。當(dāng)模型規(guī)模擴(kuò)展至萬(wàn)億量級(jí)時(shí),數(shù)據(jù)處理與計(jì)算需求已遠(yuǎn)超單機(jī)單卡能力極限,多機(jī)多卡互聯(lián)與并行訓(xùn)練策略成為必然趨勢(shì)。在海量數(shù)據(jù)的處理方面,千億參數(shù)模型的訓(xùn)練需對(duì)PB(拍字節(jié))級(jí)別的數(shù)據(jù)集使用多種協(xié)議進(jìn)行高效處理,但現(xiàn)有算力存儲(chǔ)系統(tǒng)在協(xié)議處理、數(shù)據(jù)管理、吞吐性能等方面,仍存在瓶頸。在互聯(lián)技術(shù)方面,以在超萬(wàn)卡集群部署的GPT-4大模型為例(約有1.8萬(wàn)億參數(shù)),每輪迭代計(jì)算均涉及前向與反向傳播的計(jì)算和通信,對(duì)超萬(wàn)卡集群中橫向與縱向的網(wǎng)絡(luò)架構(gòu)與升級(jí)成本管理提出挑戰(zhàn)。在算力集群的可用性與運(yùn)維方面,超萬(wàn)卡集群承載萬(wàn)億級(jí)模型訓(xùn)練任務(wù),意味著數(shù)千萬(wàn)器件需長(zhǎng)時(shí)間滿負(fù)荷高速運(yùn)轉(zhuǎn),且任一組件故障都可能導(dǎo)致訓(xùn)練中斷。一個(gè)超萬(wàn)卡集群由數(shù)千臺(tái)智算服務(wù)器、數(shù)千臺(tái)交換機(jī)、數(shù)千臺(tái)存儲(chǔ)設(shè)備、數(shù)萬(wàn)組光纖與光模塊構(gòu)成,海量元器件與器件規(guī)模的硬件失效率與硬件故障率難以有效控制,且相關(guān)軟硬件故障模式復(fù)雜多樣,管理難度巨大。
配套設(shè)施與硬件系統(tǒng)要求較高。相較傳統(tǒng)云數(shù)據(jù)中心,超萬(wàn)卡集群對(duì)于機(jī)房配套設(shè)施提出全新要求⑥。為更好支撐超萬(wàn)卡集群的快速建設(shè)、便捷部署與長(zhǎng)期運(yùn)行,該領(lǐng)域不僅對(duì)高壓直流供電技術(shù)、高效液冷散熱技術(shù)、超大規(guī)模網(wǎng)絡(luò)部署等層面,提出更高要求,也對(duì)機(jī)房配套設(shè)施的供電、承重、機(jī)房潔凈度和走線架設(shè)計(jì)等方面提出更高要求。供電方面,隨著單芯片設(shè)計(jì)功率上升至400W—700W,單機(jī)柜功率從傳統(tǒng)數(shù)據(jù)中心的7KW—8KW上升至40KW-60KW,對(duì)機(jī)房功率提升與散熱能力強(qiáng)化提出更高要求。承重方面,算力集群規(guī)模擴(kuò)大帶來(lái)單機(jī)柜重達(dá)1噸—2噸,需引入液冷技術(shù)以保障單位空間的算力密度并確保智算芯片高速運(yùn)行,對(duì)機(jī)房承重提出更高標(biāo)準(zhǔn)。
推進(jìn)國(guó)產(chǎn)算力產(chǎn)業(yè)發(fā)展的關(guān)鍵對(duì)策
強(qiáng)化基礎(chǔ)硬件自主創(chuàng)新與產(chǎn)業(yè)支撐。伴隨國(guó)內(nèi)智算中心加速部署,人工智能服務(wù)器、交換機(jī)、光模塊、光芯片、溫控設(shè)備等核心硬件需求持續(xù)攀升。為突破英特爾與AMD的X86指令集壟斷,中國(guó)企業(yè)亟須以技術(shù)和商業(yè)模式手段實(shí)現(xiàn)創(chuàng)新,推動(dòng)中低端X86兼容芯片的國(guó)產(chǎn)化替代,并在先進(jìn)封裝等新興技術(shù)替代路徑上尋求高端芯片的國(guó)產(chǎn)化突破。政策層面,應(yīng)降低西方部分國(guó)家出口管制與技術(shù)封鎖對(duì)國(guó)產(chǎn)芯片技術(shù)升級(jí)與供應(yīng)鏈穩(wěn)定性的系統(tǒng)性風(fēng)險(xiǎn)。鼓勵(lì)產(chǎn)學(xué)研聚焦國(guó)家重大需求協(xié)同攻關(guān),加大對(duì)國(guó)產(chǎn)服務(wù)器及芯片研發(fā)的投入力度,提升國(guó)產(chǎn)服務(wù)器的供給能力,為算力產(chǎn)業(yè)發(fā)展筑牢根基。
加快前沿技術(shù)布局與架構(gòu)創(chuàng)新。放眼人工智能產(chǎn)業(yè)的高速發(fā)展,包括算力基礎(chǔ)設(shè)施建設(shè)、大模型參數(shù)訓(xùn)練與應(yīng)用端增量需求,均離不開(kāi)核心技術(shù)的持續(xù)突破。例如,海外算力行業(yè)已經(jīng)著手改善以太網(wǎng)的實(shí)際應(yīng)用性能,以太網(wǎng)組網(wǎng)的大規(guī)模集群正在成為人工智能數(shù)據(jù)中心前端與后端的關(guān)鍵基礎(chǔ)設(shè)施,并成為算力升級(jí)探索的第二路徑。此外,量子計(jì)算與經(jīng)典計(jì)算結(jié)合、存算一體芯片、光子計(jì)算等新型架構(gòu),亦均是算力強(qiáng)國(guó)競(jìng)相投入的重點(diǎn)方向,我國(guó)亟需加速追趕,搶占科技發(fā)展制高點(diǎn)。
數(shù)據(jù)流動(dòng)管理與數(shù)據(jù)安全治理并重。2022年,全國(guó)一體化大數(shù)據(jù)中心體系完成總體布局,“東數(shù)西算”工程正式啟動(dòng)。國(guó)際數(shù)據(jù)公司(IDC)報(bào)告顯示,2025年中國(guó)創(chuàng)造與復(fù)制的數(shù)據(jù)量將增48.6ZB,數(shù)據(jù)生產(chǎn)量約占世界數(shù)據(jù)總量的27.8%,或?qū)⒊矫绹?guó)成為世界第一大數(shù)據(jù)生產(chǎn)國(guó)。數(shù)字時(shí)代,數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素的重要性日益凸顯。為回應(yīng)指數(shù)級(jí)增長(zhǎng)的數(shù)據(jù)規(guī)模,有必要在算力樞紐節(jié)點(diǎn)與國(guó)家數(shù)據(jù)中心部署數(shù)據(jù)收集、存儲(chǔ)、管理的集群化體系,通過(guò)常態(tài)化演練預(yù)先防范潛在數(shù)據(jù)使用風(fēng)險(xiǎn)以釋放數(shù)據(jù)價(jià)值⑦。此外,持續(xù)完善覆蓋數(shù)據(jù)全生命周期的安全治理法律框架,通過(guò)領(lǐng)先的數(shù)據(jù)安全監(jiān)管體系與管理體系,為人工智能算法模型升級(jí)提供保障,構(gòu)筑我國(guó)在數(shù)字時(shí)代的全球數(shù)據(jù)競(jìng)爭(zhēng)優(yōu)勢(shì)。
加快落實(shí)數(shù)字能源基礎(chǔ)設(shè)施建設(shè)。在“雙碳”目標(biāo)與數(shù)字經(jīng)濟(jì)協(xié)同發(fā)展的戰(zhàn)略導(dǎo)向下,應(yīng)統(tǒng)籌規(guī)劃算力布局、優(yōu)化能源供給分配并推動(dòng)能源技術(shù)創(chuàng)新,優(yōu)化多層次基礎(chǔ)設(shè)施以更好供給算力產(chǎn)業(yè)發(fā)展⑧。例如,利用智能調(diào)度算法優(yōu)化“源-網(wǎng)-荷-儲(chǔ)”一體化運(yùn)行模式,降低數(shù)據(jù)中心電能利用效率值(PUE值);研發(fā)面向高密度算力設(shè)備的液冷散熱、高壓直流供電等低碳化技術(shù);部署大模型驅(qū)動(dòng)的能耗預(yù)測(cè)與動(dòng)態(tài)調(diào)優(yōu)系統(tǒng),構(gòu)建聚合分布式算力資源的“虛擬電廠”以提升彈性響應(yīng)能力;完善綠電交易機(jī)制與碳足跡核算標(biāo)準(zhǔn),激勵(lì)企業(yè)通過(guò)購(gòu)買綠證、參與碳市場(chǎng)抵消算力碳足跡,推動(dòng)技術(shù)標(biāo)準(zhǔn)互認(rèn)與創(chuàng)新碳稅政策工具。通過(guò)構(gòu)建平衡算力與能源協(xié)同發(fā)展的制度性基礎(chǔ)設(shè)施,最終實(shí)現(xiàn)算力規(guī)模增長(zhǎng)與碳排放總量提升的大范圍脫鉤。
當(dāng)今世界,算力不僅是驅(qū)動(dòng)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展的核心引擎,也日益成為衡量國(guó)家科技水平和綜合國(guó)力的重要指標(biāo)。我國(guó)國(guó)產(chǎn)算力的快速發(fā)展不僅展現(xiàn)技術(shù)能力的飛躍,更是國(guó)家戰(zhàn)略、產(chǎn)業(yè)轉(zhuǎn)型與科技自立自強(qiáng)的綜合體現(xiàn)。自我國(guó)走上算力自主化發(fā)展道路以來(lái),以美國(guó)為首的歐美國(guó)家頻繁憑借科技優(yōu)勢(shì)對(duì)我國(guó)發(fā)起科技制裁,嚴(yán)重影響并阻遏我國(guó)科技行業(yè)發(fā)展。伴隨“數(shù)字中國(guó)”戰(zhàn)略的深化,夯實(shí)算力基礎(chǔ)、發(fā)展國(guó)產(chǎn)算力代替技術(shù),優(yōu)化算力基礎(chǔ)設(shè)施的步伐已勢(shì)不可擋。在政策層面,我國(guó)對(duì)數(shù)字經(jīng)濟(jì)的支持與保障體系持續(xù)完善,為產(chǎn)業(yè)發(fā)展提供了清晰指引和有力支撐。當(dāng)前,黨政機(jī)關(guān)及部分行業(yè)的數(shù)字化場(chǎng)景已率先應(yīng)用國(guó)產(chǎn)芯片與服務(wù)器,為國(guó)產(chǎn)算力建設(shè)提供更多確定性與發(fā)展空間,形成良好示范。未來(lái),國(guó)產(chǎn)算力產(chǎn)業(yè)將持續(xù)迭代產(chǎn)品性能,推動(dòng)國(guó)產(chǎn)算力從“可用好用”向“高效領(lǐng)先”演進(jìn),逐步建成具備全球競(jìng)爭(zhēng)力的自主算力生態(tài)。
【注:本文系國(guó)家社科基金年度項(xiàng)目“基于語(yǔ)料庫(kù)的網(wǎng)絡(luò)安全話語(yǔ)體系研究”(項(xiàng)目編號(hào):24BYY151);國(guó)家社科基金重大項(xiàng)目“建立健全我國(guó)網(wǎng)絡(luò)綜合治理體系研究”(項(xiàng)目編號(hào):20ZDA062);浙江省法學(xué)會(huì)重點(diǎn)課題“數(shù)字社會(huì)司法治理理論與規(guī)則研究”(項(xiàng)目編號(hào):2024NA19)的階段性成果】
【注釋】
①《中共中央關(guān)于制定國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十五個(gè)五年規(guī)劃的建議》,《人民日?qǐng)?bào)》,2025年10月29日。
②洪濤、程樂(lè):《全國(guó)算力體系一體化建設(shè)的五大問(wèn)題及治理對(duì)策》,《中國(guó)科學(xué)院院刊》,2024年第12期。
③金光敏、梁琳:《算力產(chǎn)業(yè)高質(zhì)量發(fā)展的價(jià)值維度、現(xiàn)實(shí)困境與推進(jìn)策略》,《經(jīng)濟(jì)縱橫》,2023年第10期。
④戚凱、楊悅怡:《人工智能時(shí)代的美國(guó)對(duì)華算力競(jìng)爭(zhēng)》,《國(guó)際論壇》,2024年第3期。
⑤錢德沛、欒鐘治、劉軼:《從網(wǎng)格到“東數(shù)西算”:構(gòu)建國(guó)家算力基礎(chǔ)設(shè)施》,《北京航空航天大學(xué)學(xué)報(bào)》,2022年第9期。
⑥丁宏慶、張鵬飛、牛紅韋華等:《云化的智算中心萬(wàn)卡集群創(chuàng)新與實(shí)踐》,《電信科學(xué)》,2024年第12期。
⑦蔡躍洲、馬文君:《數(shù)據(jù)要素對(duì)高質(zhì)量發(fā)展影響與數(shù)據(jù)流動(dòng)制約》,《數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究》,2021年第3期。
⑧王永真、唐豪、魏一鳴等:《中國(guó)數(shù)據(jù)中心綜合能耗及其靈活性預(yù)測(cè)》,《北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)》,2025年第2期。
責(zé)編/谷漩 美編/楊玲玲
聲明:本文為人民論壇雜志社原創(chuàng)內(nèi)容,任何單位或個(gè)人轉(zhuǎn)載請(qǐng)回復(fù)本微信號(hào)獲得授權(quán),轉(zhuǎn)載時(shí)務(wù)必標(biāo)明來(lái)源及作者,否則追究法律責(zé)任。