中科曙光發(fā)布百萬卡AI超集群

時間:2025-09-08

來源:電子技術應用

導語:9月8日消息,近日,中科曙光正式發(fā)布了國內首個基于AI計算開放架構設計的曙光AI超集群系統(tǒng)。

  9月8日消息,近日,中科曙光正式發(fā)布了國內首個基于AI計算開放架構設計的曙光AI超集群系統(tǒng)。這一系統(tǒng)以GPU為核心,實現(xiàn)了算力、存儲、網絡、供電、冷卻、管理與軟件的一體化緊耦合設計,旨在為萬億參數(shù)大模型訓練、行業(yè)模型微調、多模態(tài)開發(fā)及AI4S等場景提供底層算力支持。其最大亮點在于支持百萬卡級別的集群擴展能力,并強調硬件與軟件生態(tài)的開放性,引發(fā)行業(yè)對算力壟斷格局可能被打破的討論。

  從技術架構來看,曙光AI超集群表現(xiàn)出顯著性能優(yōu)勢。單機柜支持96張GPU卡,總算力達百P級,內存帶寬超過180TB/s,支持多精度與混合精度運算。在實際應用中,千卡集群的大模型訓練推理性能達業(yè)界主流水平的2.3倍,開發(fā)效率提升4倍,人天投入減少70%。其通過存算傳協(xié)同技術將GPU計算效率提升55%,并采用冷板液冷與394項節(jié)能設計,使PUE低于1.12,在能效方面也處于行業(yè)領先水平。

  更重要的是,該系統(tǒng)在可靠性與開放性上實現(xiàn)雙重突破。121項可靠性設計使平均無故障時間提高2.1倍,平均故障修復時間降低47%,支持超30天長穩(wěn)運行與百萬級部件故障的秒級隔離。而開放架構則支持多品牌AI加速卡,兼容CUDA等主流軟件生態(tài),不僅降低用戶的硬件采購與軟件開發(fā)成本,也有助于保護已有投資,避免被單一技術路線綁定。

  從行業(yè)現(xiàn)狀來看,全球AI算力市場目前仍由少數(shù)企業(yè)主導,尤其在高端加速卡與底層軟件生態(tài)方面存在較高的技術壁壘和商業(yè)壟斷。曙光AI超集群所倡導的開放路徑,在一定程度上可促進硬件異構兼容與軟件生態(tài)互通,為更多企業(yè)提供替代方案,有助于構建多元化的算力供應體系。

  然而,能否真正“打破壟斷”,仍需客觀看待其面臨的挑戰(zhàn)。一方面,現(xiàn)有主流生態(tài)已形成較強的用戶黏性與開發(fā)生態(tài),新架構需在工具鏈、性能調優(yōu)、社區(qū)支持等方面持續(xù)投入;另一方面,開放架構雖然降低準入門檻,但如何在規(guī)模部署中保持穩(wěn)定性與兼容性,仍需經過大規(guī)模應用驗證。

  總體而言,曙光AI超集群的發(fā)布是中國在高端AI算力基礎設施領域的一次重要進展,其開放架構理念為行業(yè)提供了新的發(fā)展思路。但從技術到市場、從生態(tài)到服務,能否真正改變現(xiàn)有算力格局,仍需產業(yè)各方共同推動與時間檢驗。在AI競爭日益激烈的全球背景下,開放合作與自主創(chuàng)新并重,或許是構建可持續(xù)算力未來的更優(yōu)路徑。


AI
傳動網版權與免責聲明:

凡本網注明[來源:傳動網]的所有文字、圖片、音視和視頻文件,版權均為傳動網(m.y3602.cn)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網站或個人轉載使用時須注明來源“傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯(lián)網或業(yè)內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0