找回密碼註冊
作者: sxs112.tw
查看: 6479
回復: 1

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

O11 VISION COMPACT 玩家開箱體驗分享活動

迷你身形 三面透視打造精緻PC視野新境界O11 VISION COMPACT 強強聯合 ...

2024 三星SD記憶卡 玩家開箱體驗分享活動

2024 PRO Plus SD 記憶卡 [*]為專業人士打造 [*]釋放極限速度 [*]多 ...

體驗極速WiFi 7!MSI Roamii BE Lite Mesh

MSI首款WiFi 7 Mesh系統登場-Roamii BE Lite Mesh System。Roamii ...

LANCOOL 207 玩家開箱體驗分享活動

LANCOOL 207重新構想了傳統的ATX佈局,將強大的兼容性和卓越的冷卻 ...

打印 上一主題 下一主題

[業界新聞] 全使用AMD產品的世界上第一台Exascale超級電腦Frontier自啟動以來一直遇到問題

[複製鏈接]| 回復
跳轉到指定樓層
1#
sxs112.tw 發表於 2022-10-10 11:37:01 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
橡樹嶺國家實驗室(ORNL)是Frontier超級電腦的所在地。Frontier被標記為第一個全使用AMD的EPYC Trento CPU和Instinct MI250X計算加速器打造的Exascale級系統。整個系統使用HPE的Slingshot互連。它也被認為是世界上最快的超級電腦,並且是世界上唯一可操作的Exascale級設計。
695609-AMD-ORNL-Exascale-case-study-thumbnail-1260x709-1.png

HPE的Cray EX架構是為大型應用打造的,從2023年開始研究人員將能夠訪問這些應用以協助科學研究。但是如果硬體內部出現多次故障,超級電腦無法執行一整天。ORNL Frontier啟動但最多只能產生1 FP64 ExaFLOPS,而該系統旨在提供1.685 FP64 ExaFLOPS。雖然沒有就具體問題給出任何消息,但一些謠言正在曝光。

首先為HPE Cray超級電腦打造的網路Slingshot互連與HPE集群發生衝突。可惜的是確切問題的具體情況尚不清楚。其次傳聞AMD Instinct MI250X計算GPU和EPYC Trento CPU與Slingshot互連發生衝突。同樣ORNL Frontier超級電腦的項目負責人或研究人員也沒有給出任何官方消息。
ORNL-Crusher-Node-Block-Diagram-with-AMD-EPYC-CPU-AMD-Instinct-MI250X-GPU-_1.jpg

能源部 (DOE)負責此項目的Mike Bernhardt表示ORNL Frontier的全面整合將從明年開始提供給研究人員,但並未引述對Frontier超級電腦的全面啟動有任何擔憂或問題。

Bernhardt的位置說明複雜的努力可能導致有關該項目的謠言比比皆是。還要注意的是AMD的MI250X計算GPU僅適用於特定客戶,這就是為什麼缺乏測試來支援傳聞的說法。美國能源部與橡樹嶺的領導計算設施密切合作。在錯過了最初的2022年最後期限後,ORNL Frontier超級電腦計劃於2023年1月1日全面投入執行。

消息來源




2#
clouse 發表於 2022-10-11 00:02:29 | 只看該作者
軟體設計不良導致
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-11-5 18:38 , Processed in 0.077094 second(s), 32 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表