美國加州帕洛阿爾托市舉行的第22屆Hot Chips高性能晶片大會上,AMD如約公佈了“推土機”(Bulldozer)、“山貓”(Bobcat)兩款全新處理器架構的更多技術細節。AMD院士兼推土機總設計師Mike Butler、AMD院士兼山貓總設計師Brad Burgess均出席會議並分別發表了相關演講。
推土機架構主攻性能和擴展性,面向主流用戶和伺服器領域,山貓架構的重點則是靈活性、低功耗和小尺寸,將用於低功耗設備、小型設備、雲端用戶。
推土機將採用新的模組化設計,每個模組擁有兩個四管線核心,彼此共用一個浮點調度器和兩個128位元乘法累加單元(FMAC)。兩個核心都擁有自己的整數調度器、一級資料緩存,並預取、解碼單元和二級緩存。 新架構還將有全新的x86指令集支援,包括SSE4.1、SSE4.2、AVX、XOP。
因為除了高性能計算領域之外浮點運算量並不多,這種浮點調度器共用設計能大大節省電晶體、核心面積、功耗,降低成本;兩個FMAC單元既可以被每個核心單獨使用,也可以合併組成一個256位元FMAC單元,當然這需要程式碼做相應改變。為了獲得最大程度的性能功耗比,推土機架構還會在共用、專用單元之間動態切換。
AMD宣稱,這種共用模組化設計的多執行緒執行效率要大大優於同步多執行緒(SMT)和晶片多處理(CMP)。SMT最典型的實例就是Intel的超執行緒技術,它強制兩個執行緒進入一個核心,執行緒之間會爭奪資源,影響效率;CMP則是一個執行緒對應多個專用核心,浪費資源。
再來看山貓,這是一種小尺寸、高效能、低功耗的x86核心,同時具有出色的性能,可在不同設計、製程上輕鬆移植。
山貓核心使用的是亂序執行引擎(Atom是循序執行),內建兩個x86解碼器、高級分支預測期、完整亂序指令執行、完整亂序載入與存儲引擎、高性能浮點單元、32KB一級緩存、512KB二級緩存,完整支持ISA、SSE1/2/3、SSSE3指令集和虛擬化技術,單個核心功耗可降至1W以下,估計能以不到一半的核心面積達到當今主流性能的90%。
貓架構的首款產品是即將於今年底明年初發佈、面向輕薄本和上網本的第一款Fusion APU加速處理器“安大略湖”(Ontario),確切地說是其中的CPU部分。Ontario APU之內除了山貓CPU引擎之外,還有SIMD引擎陣列(GPU圖形核心)、UVD解碼單元、高性能匯流排和記憶體控制器、系統介面,將採用台積電40nm製程。
|