找回密碼註冊
作者: XF-News
查看: 7533
回復: 0

文章分享:

+ MORE精選文章:

+ MORE活動推薦:

SAMSUNG T7 Shield 移動固態硬碟

[*]超快的移動固態硬碟,比傳統外接 HDD 快 9.5 倍 [*]堅固的儲存 ...

GEX PRO 850W玩家開箱體驗分享活動

卓越性能,超值選擇 GEX PRO 系列通過 80 PLUS 金牌認證,實現高達 ...

體驗極速WiFi 7!MSI Roamii BE Lite Mesh

第一名 guanrung1110 https://www.xfastest.com/thread-293988-1- ...

極致效能 為遊戲而生 990 PRO SSD 玩家體驗

[*]極致效能固態硬碟 [*]PCIe 4.0 速度大幅提升 [*]優化的電源效率 ...

打印 上一主題 下一主題

[活動/消息] NVIDIA 針對異質超級運算推出最新版編譯器

[複製鏈接]| 回復
跳轉到指定樓層
1#
XF-News 發表於 2017-9-19 17:46:16 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
PGI 17.7 能支援 NVIDIA Volta GPU、與 CUDA 整合記憶體互連的 OpenACC

以及搭載多核 CPU 的 OpenMP 4.5

NVIDIA (輝達) 今天宣布推出 17.7 版 PGI® 2017 編譯器與工具,協助高效能運
算系統開發者針對搭載多核 CPU 與異質化 GPU 加速器的系統,開發出效能更高
的軟體,同時大幅簡化程式設計流程。
即日釋出的 PGI 17.7 編譯器與工具的關鍵特點包括:
 支援Tesla V100 GPU: PGI OpenACC 與CUDA Fortran現已支援新款NVIDIA
Volta GV100 GPU,提供更多記憶體頻寬、串流多重處理器、新一代
NVIDIA NVLink™以及全新微架構功能,堆砌出更好的效能與可編程功能。
 OpenACC支援CUDA整合記憶體:PGI 17.7 版編譯器能利用 CUDA 整合記憶
體,簡化針對 GPU 加速系統程式的編譯流程。藉由開啟簡易編譯器選項
,OpenACC 即可在 CUDA 整合記憶體中配置資料的存放位置,而不需撰
寫資料移動程式碼或指令。
 支援多核 CPU 的 OpenMP 4.5 :初始針對 OpenMP 4.5 語法與功能的支援
,即可針對大多數運行於多核CPU系統中的 OpenMP 4.5 平行處理進行編
程。程式中的目標區塊(TARGET)在預設支援條件設定後,會將多核系統
當成目標,而PARALLEL 以及DISTRIBUTE等程式迴圈則能分散到所有
OpenMP執行緒進行平行處理。
 對Fortran語法的衍生類別進行深層複製: 透過 OpenACC 指令能在CPU主
控端與GPU元件記憶體之間搬移匯整或深層巢狀Fortran資料物件,包括
指標型物件的巡行與管理作業。
 C++ 語言方面的改良:PGI 17.7 C++ 編譯器內含許多逐次擴增的 C++17 功
能,並將其彙整到 CUDA 9.0 NVCC 主編譯器的支援範圍內。在 LCALS 迴
圈處理性能量測指標中效能平均提升了20%。
 在 OpenACC 程式區段中使用 C++14 Lambdas 函數:C++ 語言的lambdas函
數,能在匿名函式物件被呼叫或是以參數形態被傳遞時,提供一種便利
的方法來定義其物件。從 PGI 17.7 版開始,C++語言撰寫程式的 OpenACC
運算區段都支援 lambdas 函數,包括針對不同編程模型或平台生成對應
的程式碼。 C++14 則引進更多lambdas函數用法,尤其是多類型的
lambdas函數。上述這些功能都可運用在 OpenACC 程式中。

 與cuSOLVER 函式庫互通:透過使用 PGI 提供的介面模組與 PGI 17.7 內建
的 PGI 版 cuSOLVER 函式庫,即可呼叫包括 CUDA Fortran、OpenACC
Fortran、C 以及 C++ 等語言的最佳化 cuSolverDN 函式。
 支援 NVIDIA Tesla GPU與多核 CPU 處理的 PGI Unified Binary:使用
OpenACC 編譯出的程式不僅支援 GPU 加速,還能在多核CPU上支援平行
處理。在搭載GPU的系統上運行時, OpenACC 支援區段分載以及在GPU
上執行程式。當在沒有安裝GPU的系統上運行時,OpenACC 的程式區段
能分散到系統中所有CPU核心上同步處理。
 全新分析功能支援 CUDA 整合記憶體與OpenACC :PGI 17.7 Profiler現已加
入多項全新 OpenACC 分析功能,包括支援有連結 GPU 與無連結 GPU 的
兩種多核 CPU 平台,另外還新增全新的摘要(summary)檢視功能,能顯
示處理每種 OpenACC 程式碼結構所耗費的執行時間。新增的 CUDA 統合
記憶體功能,能追蹤出每項 CPU 分頁錯誤對應到哪些程式碼,以及這些
程式碼所涉及的資料所在位置,並支援全新 CUDA 整合記憶體分頁頻繁
的置換、節流、遠端對應事件、NVLink以及其他諸多功能。
PGI 17.7的其他功能與改良包括所有支援全方位平台環境模組、預製熱門開
源函式庫與程式,以及新推出的《運用 OpenACC 執行平行運算》的教學系列影
片 。
欲了解 PGI 17.7 完整的特色與功能請點此瀏覽, 即日起 PGI 17.7 將透過 PGI
官網開放給 PGI Professional 維護方案訂購用戶下載。
掌握PGI最新動態
請訂閱PGInisder掌握最新技術與第一手資訊或追蹤Twitter與LinkedIn。瀏覽OpenACC相關
影片,請至YouTube。
掌握 NVIDIA 最新動態
請訂閱 NVIDIA 官方部落格或追蹤  Facebook 、Google+、Twitter、LinkedIn 與Instagram。瀏
覽 NVIDIA 相關影片及圖片,請至 YouTube 或 Flickr。
關於PGI 編譯器與工具
PGI 為 NVIDIA 旗下品牌,其擁有高效能平行處理 Fortran、C 與C++ 編譯器與工具,除了
支援 x86-64 與搭載 OpenPOWER CPU 處理器的系統,其也能將 NVIDIA Tesla GPU 加速器
的平台運行於 Linux、微軟Windows 與蘋果 macOS 等作業系統。想瞭解更多資訊,敬請
瀏覽官網 www.pgicompilers.comc或洽詢sales@pgroup.com 與 (503) 682-2806。
關於NVIDIA (輝達)

NVIDIA (輝達) 為人工智慧運算公司,自1999年發明GPU起,成功促進PC電競市場
的成長並重新定義現代電腦顯示卡產品,掀起電腦平行運算革命。近年來GPU深度學
習也促發被視為下一個運算時代的人工智慧,透過GPU以類人腦方式運作於電腦、機
器人與自駕車等,來感知並解讀真實世界。欲瞭解更多資訊,請瀏覽
www.nvidia.com.tw/object/newsroom_tw.html 以及 blogs.nvidia.com.tw。
更多圖片 小圖 大圖
組圖打開中,請稍候......
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則

小黑屋|手機版|無圖浏覽|網站地圖|XFastest  

GMT+8, 2024-12-19 07:15 , Processed in 0.074399 second(s), 34 queries .

專業網站主機規劃 威利 100HUB.COM

© 2001-2018

快速回復 返回頂部 返回列表