登錄
微信登錄
打開手機(jī)微信,掃描二維碼
掃描成功
請勿刷新本頁面,按手機(jī)提示操作
中科曙光不會以任何理由要求您轉(zhuǎn)賬匯款,謹(jǐn)防詐騙
您的微信還未注冊
中科曙光不會以任何理由要求您轉(zhuǎn)賬匯款,謹(jǐn)防詐騙
您可以同時(shí)關(guān)注中科曙光微信公眾號
使用微信掃一掃即可登錄! 查閱資料更方便、 快捷!
您已經(jīng)注冊賬號和
關(guān)注微信公眾號
2025年1月
服務(wù)熱線:400-810-0466
發(fā)布時(shí)間: 2025-09-08
在AI加速滲透的進(jìn)程中,算力基礎(chǔ)設(shè)施演進(jìn)與大模型發(fā)展形成相生相長的關(guān)系:從初期的囤積GPU追求“大力出奇跡”,到后來的系統(tǒng)級創(chuàng)新打破應(yīng)用瓶頸,再到如今的智算集群躍遷驅(qū)動AI全面落地,螺旋式上升的曲線清晰可見。

由于外部環(huán)境存在諸多不確定性因素,國內(nèi)智算集群的進(jìn)化路徑頗為引人注目。針對單卡性能尚存差距、算力成本較高、自主軟硬件協(xié)同不太成熟等痛點(diǎn),AI超節(jié)點(diǎn)、大集群等產(chǎn)品方案紛紛涌現(xiàn),以網(wǎng)聯(lián)算、以存提算、以電補(bǔ)算等創(chuàng)新方法不斷升級。
與技術(shù)、產(chǎn)品、解決方案層面的突破相比,整個(gè)智算生態(tài)系統(tǒng)的構(gòu)建更為重要。縱觀歷史上關(guān)鍵技術(shù)的普及軌跡,會發(fā)現(xiàn)主要有兩個(gè)可選路徑:一是依靠少數(shù)巨頭打造的封閉式全棧垂直體系,二是基于開放架構(gòu)、產(chǎn)業(yè)鏈各環(huán)節(jié)共同參與的協(xié)作生態(tài)。兩者不是非此即彼的替代關(guān)系,但前者往往擁有強(qiáng)勢地位,后者要贏得發(fā)展空間必須付出巨大的努力。
對國內(nèi)智算產(chǎn)業(yè)而言,面前的挑戰(zhàn)紛繁復(fù)雜,亟需將產(chǎn)業(yè)鏈上的大量企業(yè)組織起來,實(shí)現(xiàn)真正的跨層協(xié)作優(yōu)化,進(jìn)而打造開放式、標(biāo)準(zhǔn)化、高效率的集群算力,才更有機(jī)會在日趨白熱化的競爭中取得主動權(quán)。不過,這條道路充滿荊棘,橫亙在前方的技術(shù)墻與生態(tài)墻極難跨越,市場呼喚開路先鋒的引領(lǐng)與垂范。

在近日重慶舉辦的世界智能產(chǎn)業(yè)博覽會上,中科曙光協(xié)同AI芯片、AI整機(jī)、大模型等20多家產(chǎn)業(yè)鏈上下游企業(yè),共同發(fā)布國內(nèi)首個(gè)AI計(jì)算開放架構(gòu),推出AI超集群系統(tǒng),開放多項(xiàng)技術(shù)能力,并宣布依托國家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心啟動 “AI計(jì)算開放架構(gòu)聯(lián)合實(shí)驗(yàn)室” 建設(shè)。這一系列舉措標(biāo)志著國內(nèi)智算產(chǎn)業(yè)正在邁向全面開放與緊密協(xié)作的新時(shí)代,由技術(shù)創(chuàng)新到生態(tài)突圍的范式變革漸入佳境,難而正確的道路有望成為新的共識。
▍開放架構(gòu)是生態(tài)繁榮的核心基石
無論是ToB還是ToC領(lǐng)域,開放架構(gòu)都能在一定程度上促進(jìn)產(chǎn)業(yè)生態(tài)繁榮。
在大型機(jī)和小型機(jī)當(dāng)?shù)赖摹吧瞎拧睍r(shí)期,橫空出世的X86即是開放架構(gòu)的代名詞,由此吹響了PC和服務(wù)器普惠的號角;在蘋果手機(jī)所向披靡的階段,崇尚開放路線的安卓系統(tǒng)徹底改變一家獨(dú)大的局面,開啟了更多產(chǎn)業(yè)鏈環(huán)節(jié)共創(chuàng)共榮的智能手機(jī)新紀(jì)元。

中科曙光高級副總裁李斌
中科曙光高級副總裁李斌表示:過去,傳統(tǒng)IT產(chǎn)業(yè)分工明確,技術(shù)架構(gòu)進(jìn)化速度較慢,跨界、跨層協(xié)同的需求并不迫切;而當(dāng)下的智算產(chǎn)業(yè)鏈條更長且技術(shù)融合趨勢明顯,唯有踐行安卓式的開放生態(tài)創(chuàng)新,才能有效應(yīng)對快速變化的市場環(huán)境,達(dá)成“抱團(tuán)發(fā)展”的目標(biāo)。
從某種意義上講,智算集群已成為AI時(shí)代算力基礎(chǔ)設(shè)施的中流砥柱,肩負(fù)著探索開放架構(gòu)、建立嶄新生態(tài)的千鈞重任。作為國內(nèi)智算產(chǎn)業(yè)的翹楚,中科曙光將扮演破局者的角色。過去十年,中科曙光先后建設(shè)了20多個(gè)大規(guī)模算力集群,累計(jì)部署超過50萬張異構(gòu)加速卡,積累了豐富的實(shí)戰(zhàn)經(jīng)驗(yàn);與此同時(shí),其還是國家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心的牽頭組建單位,有能力也有責(zé)任推動AI計(jì)算領(lǐng)域的開放協(xié)作與生態(tài)構(gòu)建。
正是在這樣的背景下,AI計(jì)算開放架構(gòu)脫穎而出——面向大規(guī)模智能計(jì)算場景,創(chuàng)建以GPU為核心進(jìn)行高效率緊耦合系統(tǒng)設(shè)計(jì)的協(xié)同創(chuàng)新體系,旨在聯(lián)動芯片、整機(jī)、大模型、行業(yè)應(yīng)用等產(chǎn)業(yè)鏈上下游企業(yè),從“算、存、網(wǎng)、電、冷、管、軟”單點(diǎn)突破走向集群創(chuàng)新。借助開放跨層協(xié)作優(yōu)化,AI計(jì)算開放架構(gòu)有望突破多重瓶頸,形成多元算力、高速互連、存算協(xié)同、綠色高效、穩(wěn)定可靠、生態(tài)繁榮等核心優(yōu)勢,讓AI算力普惠從夢想照進(jìn)現(xiàn)實(shí)。
▍AI超集群系統(tǒng)將智算底座的選擇權(quán)交給用戶
知名研究機(jī)構(gòu)Gartner近日首次發(fā)布《2025中國AI趨勢》研究報(bào)告,指出“在受限條件下的技術(shù)突圍與系統(tǒng)性重塑”是中國AI產(chǎn)業(yè)發(fā)展的必由之路。這也恰是國內(nèi)智算領(lǐng)域謀求更大發(fā)展空間的不二之選,打造具有示范效應(yīng)的行業(yè)標(biāo)桿迫在眉睫。

中科曙光總裁助理、智能計(jì)算產(chǎn)品事業(yè)部總經(jīng)理杜夏威
化解大模型訓(xùn)推與AI應(yīng)用落地的主要障礙,是集群系統(tǒng)贏得用戶認(rèn)可的首要因素。中科曙光總裁助理、智能計(jì)算產(chǎn)品事業(yè)部總經(jīng)理杜夏威透露,曙光AI超集群系統(tǒng)擁有“超高性能、超高效率、超高可靠、全面開放”四大特征,可為萬億參數(shù)大模型訓(xùn)練推理、行業(yè)大模型微調(diào)、高通量推理、多模態(tài)大模型開發(fā)、AI4S等場景打造更強(qiáng)大、高效的算力底座。
伴隨大模型應(yīng)用不斷向縱深挺進(jìn),對集群系統(tǒng)的綜合能力提出了前所未有的要求。曙光AI超集群單機(jī)柜支持96加速卡、百P級AI算力,最大可實(shí)現(xiàn)百萬卡超大規(guī)模集群擴(kuò)展,并通過“超級隧道”AI存儲優(yōu)化、軟硬協(xié)同設(shè)計(jì)、智能調(diào)度大模型等技術(shù)創(chuàng)新,實(shí)現(xiàn)系統(tǒng)效能大幅提升。相關(guān)實(shí)測顯示,千卡集群大模型訓(xùn)推性能達(dá)到主流水平2.3倍,模型開發(fā)效率提升4倍,GPU算效增加55%,平均無故障時(shí)間提高2.1倍,平均故障修復(fù)時(shí)間降低47%,多項(xiàng)指標(biāo)位居領(lǐng)先地位。
尤值一提的是,與專有封閉系統(tǒng)相比,曙光AI超集群可適配多品牌GPU加速卡,且兼容CUDA等主流軟件生態(tài),為用戶提供開放性的多元選擇,顯著降低硬件投入和軟件開發(fā)適配成本。這是開放生態(tài)送給用戶的最好禮物,富有活力的智算土壤終將迎來百花齊放。
文章轉(zhuǎn)載自:IT創(chuàng)事記

津公網(wǎng)安備 12011602000521號

津公網(wǎng)安備 12011602000521號



注冊 /