找回密碼註冊
作者: sxs112.tw
查看: 6325
回復: 1

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

極致效能優化 三星990 EVO 玩家體驗分享活

[*]進化日常效能 極致效能優化、電源效率提升、廣泛的通用 ...

FSP VITA GM White 玩家開箱體驗分享活動

中秋佳節,全漢加碼活動來囉~ [*]符合最新 Intel ® ATX 3.1電源設 ...

FV150 RGB 玩家開箱體驗分享活動

粉紅控趕快看過來.......廠商加碼活動來囉~ 心動了嗎? 想取得體驗 ...

海韻創新技術分享會 會後分享--得獎公告

頭獎:dwi0342 https://www.xfastest.com/thread-290899-1-1.html ...

打印 上一主題 下一主題

[業界新聞] 全使用AMD產品的世界上第一台Exascale超級電腦Frontier自啟動以來一直遇到問題

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2022-10-10 11:37:01 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
橡樹嶺國家實驗室(ORNL)是Frontier超級電腦的所在地。Frontier被標記為第一個全使用AMD的EPYC Trento CPU和Instinct MI250X計算加速器打造的Exascale級系統。整個系統使用HPE的Slingshot互連。它也被認為是世界上最快的超級電腦,並且是世界上唯一可操作的Exascale級設計。
695609-AMD-ORNL-Exascale-case-study-thumbnail-1260x709-1.png

HPE的Cray EX架構是為大型應用打造的,從2023年開始研究人員將能夠訪問這些應用以協助科學研究。但是如果硬體內部出現多次故障,超級電腦無法執行一整天。ORNL Frontier啟動但最多只能產生1 FP64 ExaFLOPS,而該系統旨在提供1.685 FP64 ExaFLOPS。雖然沒有就具體問題給出任何消息,但一些謠言正在曝光。

首先為HPE Cray超級電腦打造的網路Slingshot互連與HPE集群發生衝突。可惜的是確切問題的具體情況尚不清楚。其次傳聞AMD Instinct MI250X計算GPU和EPYC Trento CPU與Slingshot互連發生衝突。同樣ORNL Frontier超級電腦的項目負責人或研究人員也沒有給出任何官方消息。
ORNL-Crusher-Node-Block-Diagram-with-AMD-EPYC-CPU-AMD-Instinct-MI250X-GPU-_1.jpg

能源部 (DOE)負責此項目的Mike Bernhardt表示ORNL Frontier的全面整合將從明年開始提供給研究人員,但並未引述對Frontier超級電腦的全面啟動有任何擔憂或問題。

Bernhardt的位置說明複雜的努力可能導致有關該項目的謠言比比皆是。還要注意的是AMD的MI250X計算GPU僅適用於特定客戶,這就是為什麼缺乏測試來支援傳聞的說法。美國能源部與橡樹嶺的領導計算設施密切合作。在錯過了最初的2022年最後期限後,ORNL Frontier超級電腦計劃於2023年1月1日全面投入執行。

消息來源




2#
clouse 發表於 2022-10-11 00:02:29 | 只看該作者
軟體設計不良導致
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-9-23 08:23 , Processed in 0.076624 second(s), 32 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表