從電路模擬的復雜推演到量子化學的微觀分析,大規模稀疏線性方程組的高效求解是科學計算領域的核心需求。但傳統稀疏直接求解器因數據非零元分布稀疏且不規則,導致運算低效、算力浪費等問題。近日,中國科學技術大學計算機科學與技術學院特任副研究員陳俊仕團隊,在鯤鵬昇騰科教創新卓越中心的算力支持下,創新研發出面向鯤鵬處理器矩陣算力基于密集kernel的LU直接求解器,以密集運算方式實現了稀疏計算的高效求解,成功突破傳統運算瓶頸。

該研究創新構建了一種面向稀疏矩陣計算的密集計算范式,系統化解構了傳統稀疏直接求解器的性能瓶頸。團隊通過將分散的非零元整合為更加規整的密集數據塊,將不規則稀疏矩陣映射為統一稠密的大塊結構,進而采用基于稠密矩陣運算的數值分解算法,取代傳統稀疏運算中聚合非零小分塊的碎片化計算模式,顯著降低了由不規則內存訪問引發的計算與調度開銷,最終實現了計算效率與硬件利用率的協同優化。
該方案的順利落地,深度依賴于鯤鵬平臺的計算特性。硬件層面,鯤鵬920新型號集成專用矩陣運算單元,原生具備高密度數值分解運算的高效承載能力,可精準匹配密集數據塊的集中化處理需求;其多核架構為大規模密集數據塊的并行運算提供了堅實基礎,避免算力閑置或過載。軟件層面,鯤鵬 KML 數學庫針對密集型矩陣運算進行深度優化,通過底層算法與硬件架構的協同,進一步放大了密集運算模式的性能潛力。經 70 余個跨領域測試集驗證,該方案性能較SuperLU 求解器平均加速32.2倍,在基礎硬件配置下實現了平均 9.6 倍性能加速,大幅壓縮了科學計算的時間成本。
目前,相關研究成果已發表于 CCF B 類國際會議 Euro-Par 2025,其核心技術已申請中國發明專利并獲得授權。此次成果是鯤鵬平臺在科學計算領域的典型實踐,該方法對于現代高性能處理器上稀疏計算問題的高效求解、充分地發揮處理器上的矩陣運算單元具有很好的應用價值。未來,隨著鯤鵬生態的持續完善,其在高性能計算領域的賦能作用將進一步凸顯,助力更多科研團隊突破技術難關,推動科研成果加速落地轉化。
請輸入留言內容
我要留言
請輸入留言內容
我要留言
確定留言
|
|
2026年人力資源服務協同發展座談會在昆明成功舉辦2026年2月26日,由東方睿智(北京)國際人力資源有限公司主辦的“鏈接產業·賦能人才——2026年人力資源..
|
|
|
|
深化中越職教交流 以標準服務助力職教出海在WorldSkillsShanghai2026CompetitionPreparationWeek舉辦期間,越南教育與培訓部(MinistryofEducationan..
|
|
|
|
深入推進集成電路產業布局,學大教育戰略投資天數智芯與啟芯領航近日,A股上市企業學大(廈門)教育科技集團股份有限公司(000526.SZ)(以下簡稱“學大教育”“公司”)..
|
|
|
|
趣味賦能素質教育,元蘿卜AI機器人扎根多校課堂人工智能技術日益成熟,其應用場景已延伸至中小學課堂。在政策指引與校內實踐的共同促進下,商湯科技旗下..
|
|
|
|
民進中央調研組至句象書店考察全民閱讀融合家校社協同育人的創新實踐1月28日,民進中央調研組在滬考察調研期間,專程前往民進會員企業學大教育集團旗下句象書店上海花木時光..
|
|
|
|
易才集團全新IP形象易小才亮相,重構人力資源服務新體驗1月26日,易才集團正式對外發布全新IP形象“易小才”。作為易才集團AI戰略布局的具象化載體之一與品牌年..
|
|
|
|
陳一丹百萬獎教獎學金激勵,武漢學院為學子搭特別之橋1月14日,由騰訊主要創始人、武漢學院創辦人陳一丹設立的第十六屆“陳一丹獎教獎學金”頒獎。本屆共有20..
|
|
|
|
科技賦能法考新篇章,瑞達教育2025考季年度盛典順利收官2026年1月10日,榮耀加冕·逐夢同行——瑞達教育2025考季年度盛典在京舉行。來自全國各地的優秀學員代表..
|
|
|
|
昇騰賦能 TransMLA:突破壁壘助大模型適配MLA(Multi-head Latent Attention多頭潛在注意力架構)憑借低秩壓縮KV緩存設計,實現長上下文推理的顯存..
|
|
|
|
立邦成為上海市首批“一試雙證”職業技能認定企業1月8日,上海市人力資源和社會保障局發布《關于公布上海市首批“一試雙證”職業技能比照認定目錄的通知》..
|
|
|
首頁
|
紅人堂
|
發布
|
我發的
|
更多
|