九九这里有精品,色婷婷久久综合中文久久蜜桃,操比动态图,久草热草,**aaaa毛片免费视频,一级毛片aa**免费观看,成人免费aaaaa毛片

中國(guó)企業(yè)報(bào)集團(tuán)主管主辦

中國(guó)企業(yè)信息交流平臺(tái)

微博 微信

算力存力Buff都疊滿,至強(qiáng)6最強(qiáng)形態(tài)現(xiàn)身!

2024-09-27 11:26 來(lái)源:中國(guó)企業(yè)網(wǎng) 次閱讀
 
算力存力Buff都疊滿,至強(qiáng)6最強(qiáng)形態(tài)現(xiàn)身!

2024年是至強(qiáng)的大年。

先于6月正式發(fā)布的至強(qiáng)? 6700E系列開(kāi)啟了全新的、更為簡(jiǎn)潔命名方式:至強(qiáng)? 6能效核。144核的規(guī)格也意味著英特爾在最近幾年當(dāng)中首次在核心數(shù)量方面實(shí)現(xiàn)了領(lǐng)先。而且,這還并不是至強(qiáng)6的最強(qiáng)形態(tài),畢竟大家都知道還有個(gè)6900P系列嘛。

9月26日,至強(qiáng)6這個(gè)“最強(qiáng)形態(tài)”終于正式發(fā)布,主要規(guī)格非常震撼。即使面對(duì)今年內(nèi)晚于自己發(fā)布的其他廠商同級(jí)別CPU,至強(qiáng)? 6900P的已有規(guī)格也戰(zhàn)力十足。

最強(qiáng)至強(qiáng)能有多強(qiáng)?

英特爾代號(hào)Birch Stream的新一代服務(wù)器平臺(tái)所采用的至強(qiáng)6處理器是分批次發(fā)布的。6月發(fā)布的是代號(hào)Sierra Forest的能效核處理器6700E系列(E后綴即Efficiency Core,能效核的標(biāo)記),目前發(fā)布的是代號(hào)Granite Rapids的性能核6900P系列。今年底和明年初還會(huì)陸續(xù)發(fā)布6900E、6700P,以及6500/6300等。未來(lái)的Intel 18A制造工藝的處理器,如Clearwater Forest,也會(huì)繼續(xù)用于Birch Stream平臺(tái)。

至強(qiáng)6900P是英特爾專為計(jì)算密集型工作負(fù)載設(shè)計(jì)的處理器,也是Granite Rapids的“完全體”。后綴的“P”意味其采用的是Performance Core,即性能核,規(guī)模大、性能強(qiáng);6900的數(shù)字型號(hào)則說(shuō)明其核心配置拉滿——提供了72到128核的多種規(guī)格,TDP有400W和500W兩種,組合成已公開(kāi)5種型號(hào),顯得比較簡(jiǎn)潔。當(dāng)然,依照慣例,云廠商等大客戶還會(huì)有若干定制型號(hào)的。單就內(nèi)核數(shù)量而言,6900P系列相對(duì)前兩代“Rapids”產(chǎn)品線頂配的56/60(Sapphire Rapids)或64核(Emerald Rapids)直接翻倍!如此巨大的迭代幅度非常罕見(jiàn),也難怪英特爾要改命名方式了,由表及里都透著一個(gè)意思:厚積薄發(fā)、脫胎換骨!

尤為值得一提的是:至強(qiáng)6900P也是業(yè)內(nèi)首款性能核數(shù)量正式“破百”的產(chǎn)品,其他同級(jí)產(chǎn)品,不論是x86架構(gòu)還是Arm架構(gòu)都只達(dá)到了96核的水平。它們的性能核數(shù)量要追平英特爾,起碼得等到下個(gè)季度。

隨著內(nèi)核規(guī)模增加,至強(qiáng)6900P的L3緩存達(dá)到了504MB。為了配合倍增的核數(shù)和顯著提升的算力,至強(qiáng)6900系列的存力也大為增強(qiáng),內(nèi)存帶寬方面不僅支持12通道DDR5 6400;并引入了新型內(nèi)存MR DIMM,把數(shù)據(jù)率大幅提升至8800MT/s,基本內(nèi)存帶寬可以達(dá)到第五代至強(qiáng)可擴(kuò)展處理器的2.3倍。另外,至強(qiáng)6還支持CXL 2.0,尤其是包括Type 3設(shè)備(也就是CXL內(nèi)存),可以進(jìn)一步擴(kuò)展內(nèi)存容量和帶寬。

至強(qiáng)6900P的UPI2.0鏈路也有很大改進(jìn),速率提升到24GT/s,數(shù)量增加至6條,使得雙路互聯(lián)效率進(jìn)一步提升。結(jié)合內(nèi)核數(shù)量、內(nèi)存帶寬等方面的全面提升,至強(qiáng)6900P可以被視作高算力+高存力平臺(tái)的最強(qiáng)機(jī)頭,不論是科學(xué)計(jì)算,還是AI集群。根據(jù)已透露的測(cè)試,至強(qiáng)6900P平臺(tái)的數(shù)據(jù)庫(kù)、科學(xué)計(jì)算等關(guān)鍵應(yīng)用負(fù)載的表現(xiàn)是上一代產(chǎn)品的2.31倍-2.5倍,AI應(yīng)用性能是其1.83倍-2.4倍不等。

至強(qiáng)6的擴(kuò)展能力也有不小的提升。其中6900系列單插座不論是性能核還是能效核均可提供96通道PCIe 5.0,雙路即可提供192通道PCIe 5.0。未來(lái)上市的6700系列單路型號(hào)可以提供136通道PCIe 5.0,雙/多路型號(hào)單插槽也可以提供88通道。相較而言,第四、五代至強(qiáng)可擴(kuò)展處理器的PCIe 5.0通道數(shù)量為80。CXL支持能力方面,至強(qiáng)6 6900、6700系列都支持64通道CXL 2.0。

更多的內(nèi)核、更多的內(nèi)存通道、更多的PCIe通道需要更大規(guī)模的插座接口支持。 至強(qiáng)6帶來(lái)了兩種接口:LGA 4710和LGA 7529。至強(qiáng)6900系列使用面積較大的LGA 7529插座,提供最強(qiáng)大的內(nèi)存帶寬和擴(kuò)展能力,是未來(lái)高性能、高密度服務(wù)器的基礎(chǔ)。至強(qiáng)6700以及未來(lái)的6500/6300系列使用LGA 4710,尺寸與第四、五代至強(qiáng)的LGA 4677相仿,內(nèi)存、PCIe的通道數(shù)相同或相近,有利于主流服務(wù)器內(nèi)部布局習(xí)慣的延續(xù)性。

改進(jìn)的EUV:Intel 3

核心規(guī)模的飆升首先得益于至強(qiáng)產(chǎn)品線終于獲得EUV光刻機(jī)的加持。在2023年發(fā)布的酷睿Ultra已經(jīng)率先使用了引入EUV的Intel 4制造工藝。而2024年發(fā)布的至強(qiáng)6則使用了進(jìn)一步改良的Intel 3制造工藝。

2021年7月,英特爾CEO帕特·基爾辛格公布了“四年五個(gè)制程節(jié)點(diǎn)”(5N4Y)的工藝路線圖。Intel 3的量產(chǎn)時(shí)間節(jié)點(diǎn)位于2023年底,節(jié)奏基本符合計(jì)劃。從基于Intel 4制造工藝的酷睿Ultra的市場(chǎng)表現(xiàn)看,EUV的加持確實(shí)明顯提升了英特爾處理器的競(jìng)爭(zhēng)力。至強(qiáng)6所采用的Intel 3制造工藝相對(duì)Intel 4可以規(guī)劃更多的金屬層、擁有更多細(xì)分版本。

Intel 3在更多的步驟中應(yīng)用EUV光刻,可以提供更密集的設(shè)計(jì)庫(kù)、更高的晶體管驅(qū)動(dòng)電流。Intel 3還有三種變體,包括3-T、3-E和3-PT。Intel 3、3-T是基本工藝,主要用于CPU;3-E是功能擴(kuò)展;三者都支持TSV;Intel 3的這三種變體與Intel 4相比可以提升18%的性能功耗比。而3-PT進(jìn)一步增加混合鍵合的支持能力,帶來(lái)了更高的性能并且易于使用。Intel 3所有四種節(jié)點(diǎn)變體都支持240 nm高性能和210 nm高密度庫(kù),而Intel 4只支持240 nm高性能庫(kù)。

對(duì)于性能取向,Intel 3針對(duì)高性能運(yùn)算進(jìn)行優(yōu)化,可以支持低電壓(<0.65V)和高壓(>1.3V)運(yùn)行,且在各電壓下的頻率均高于Intel 4。

微架構(gòu)大迭代

至強(qiáng)6900P采用的性能核微架構(gòu)代號(hào)Redwood Cove。Redwood Cove也是近年來(lái)英特爾最重要的微架構(gòu)迭代,不但給服務(wù)器產(chǎn)品線帶來(lái)了新名字,在消費(fèi)類產(chǎn)品線同樣開(kāi)啟了新的命名序列酷睿Ultra。

我們先快速回顧一下Redwood Cove的上一代Golden Cove/ Raptor Cove。Golden Cove其實(shí)也是非常重要的迭代,在消費(fèi)類開(kāi)啟了大小核時(shí)代(第12代酷睿處理器),在服務(wù)器上就是第四代至強(qiáng)可擴(kuò)展處理器。Golden Cove相對(duì)其前代的微架構(gòu)大幅度提升了前端:

  • 指令TLB翻倍,從128條增加到256條;

  • 指令提取帶寬從每周期16字節(jié)翻倍到32字節(jié);

  • 解碼器從4路擴(kuò)展到6路;

  • 微操作緩存從2304條增加到4096條;

  • 其他L1 BTB、L2 BTB等也有所提升。

Golden Cove的后端當(dāng)然也有提升,譬如重排序緩沖區(qū)、分支目標(biāo)緩沖區(qū)也有大概30%左右的提升,只是相對(duì)前端幅度不那么大。

Raptor Cove的微架構(gòu)與Golden Cove差異不大,表現(xiàn)在實(shí)際產(chǎn)品上主要是緩存的提升,如基于Raptor Coved的第13代酷睿(Raptor Lake)的每核心L2緩存從12代(Alder Lake)的1.25MB提升到2MB;第五代至強(qiáng)可擴(kuò)展處理器(Emerald Rapids)和第四代(Sapphire Rapids)每個(gè)核心的L2緩存都是2MB,但前者每個(gè)網(wǎng)格的末級(jí)緩存(Last Level Cache,也可繼續(xù)俗稱為L(zhǎng)3緩存)從后者的1.875MB猛增到5MB。

Redwood Cove相對(duì)Golden Cove/ Raptor Cove的最重要變化是:

  • 指令緩存從32KB增加到了16路、64KB;

  • 微操作隊(duì)列從144個(gè)條目增加到192個(gè)條目;

  • 指令執(zhí)行延遲降低;

  • 更智能的預(yù)取和改進(jìn)的BPU;

  • L2緩存的帶寬有所提升;

  • AMX增加FP16支持。

當(dāng)然,Redwood Cove還有一個(gè)重大的優(yōu)勢(shì)就是“命好”,也就是前面提到的EUV制造工藝。但即使有革命性的制造工藝加持,至強(qiáng)6性能核也沒(méi)過(guò)分?jǐn)U張每個(gè)內(nèi)核的規(guī)模。就至強(qiáng)6性能核的內(nèi)核而言,每個(gè)網(wǎng)格節(jié)點(diǎn)是一個(gè)P核,每個(gè)P核配置私有的2MB L2緩存,以及共享的4MB 末級(jí)緩存。雖然平均到每個(gè)核的緩存容量并不比上一代至強(qiáng)(Emerald Rapids)多,但勝在總核數(shù)翻倍后。至強(qiáng)6性能核每個(gè)處理器可共享的末級(jí)緩存總?cè)萘恳琅f達(dá)到504MB,遠(yuǎn)超第五代的320MB和第四代的112.5MB。

在此也順便提一下至強(qiáng)6能效核的微架構(gòu)Crestmont。這個(gè)微架構(gòu)同樣出現(xiàn)在了酷睿Ultra的能效核當(dāng)中。Crestmont是2或4個(gè)內(nèi)核為一組共享L2緩存。在至強(qiáng)6能效核當(dāng)中,每2或4個(gè)內(nèi)核與4MB的L2緩存(在酷睿Ultra中則為2MB)構(gòu)成一個(gè)模塊,這幾個(gè)內(nèi)核共享頻率和電壓域。這個(gè)模塊對(duì)應(yīng)的網(wǎng)格還擁有可整個(gè)處理器全部?jī)?nèi)核共享的3MB的末級(jí)緩存。換句話說(shuō),雖然至強(qiáng)6能效核的核數(shù)更多,但實(shí)際上網(wǎng)格規(guī)模比至強(qiáng)6性能核小。

能效核的指令緩存與性能核都是64KB,但數(shù)據(jù)緩存分別是32KB和48KB。前端的指令解碼器寬度也有差異,分別為6和8寬。指令亂序執(zhí)行引擎差異較大,能效核是256條而性能核是512條。能效核不支持性能核所支持的AVX-512和AMX,這也可以明顯減小矢量運(yùn)算單元的晶體管占用,但代價(jià)是每周期的單精度浮點(diǎn)運(yùn)算次數(shù)有了數(shù)量級(jí)的差異。但能效核也改進(jìn)了AVX2,增加了VNNI的INT8和BF16/FP16快速轉(zhuǎn)換,這樣在處理AI應(yīng)用的時(shí)候表現(xiàn)也還有所改善。另外,其256位加密和1024/2048密鑰也獲得了能效核的支持,確保至強(qiáng)6平臺(tái)的安全水平基本一致。

緩存規(guī)模、前端寬度以及矢量單元的差異,使得至強(qiáng)6性能核和能效核有不同的定位。早先發(fā)布的至強(qiáng)6能效核更適合微服務(wù)等運(yùn)算強(qiáng)度相對(duì)較輕,可在高核心數(shù)量和規(guī)模擴(kuò)展方面收益的任務(wù),以追求更高的能效、更高的機(jī)架利用率。而現(xiàn)在發(fā)布的至強(qiáng)6性能核更適合大數(shù)據(jù)、建模仿真等計(jì)算密集型和人工智能任務(wù),為高性能優(yōu)化,單顆處理器的功耗直飚500W——當(dāng)然,跟同期發(fā)布的Gaudi AI加速器的新品或類似的加速器產(chǎn)品相比,能耗是應(yīng)有的代價(jià),有能力提升性能上限才是正經(jīng)事。

內(nèi)存性能大躍進(jìn)

內(nèi)存(DRAM)的數(shù)據(jù)存儲(chǔ)依賴電容,這個(gè)特點(diǎn)使其微縮和提速的難度大于晶體管。因此內(nèi)存并沒(méi)有沾摩爾定律的光,帶寬和密度的增長(zhǎng)落后于CPU、GPU的發(fā)展。內(nèi)存帶寬滯后于CPU內(nèi)核數(shù)量的增長(zhǎng)導(dǎo)致一個(gè)長(zhǎng)期問(wèn)題:平均每個(gè)內(nèi)核的內(nèi)存帶寬增長(zhǎng)乏力,甚至出現(xiàn)倒退。譬如第三代至強(qiáng)可擴(kuò)展處理器內(nèi)核數(shù)28,內(nèi)存是八通道DDR4 3200,理論上的內(nèi)存總帶寬為205GB/s,平均每核7.3GB/s;四代是56或60核,內(nèi)存八通道DDR5 4800,總帶寬307GB/s,平均每核5.5GB/s;五代提升到DDR5 5600,內(nèi)核再增加到64,平均帶寬改進(jìn)甚微。第四、五代至強(qiáng)可擴(kuò)展處理器雖然引入了新一代的DDR5內(nèi)存,但由于內(nèi)核數(shù)量相對(duì)三代翻倍,內(nèi)存帶寬的增長(zhǎng)幅度還是跟不上。同時(shí)期其他廠商的CPU核數(shù)在屢屢躍進(jìn)的過(guò)程當(dāng)中也存在同樣的問(wèn)題。為了彌補(bǔ)內(nèi)存帶寬增長(zhǎng)較慢的問(wèn)題,第四代至強(qiáng)可擴(kuò)展處理器給部分用于科學(xué)計(jì)算的型號(hào)引入了HBM,五代則大幅度增加了末級(jí)緩存的容量,并支持CXL 2.0內(nèi)存擴(kuò)展。

在至強(qiáng)6900P上,內(nèi)存問(wèn)題終于得到了比較好的解決。這涉及三個(gè)角度:

1.大容量末級(jí)緩存。前面提到過(guò),6900P每個(gè)網(wǎng)格提供4MB L3,總?cè)萘窟_(dá)到了504MB,分別是四代的4.5倍、五代的1.6倍。而且,至強(qiáng)的全網(wǎng)格架構(gòu)使得任意內(nèi)核訪問(wèn)末級(jí)緩存的延遲相比其他廠商的一些產(chǎn)品有更優(yōu)的表現(xiàn),例如不需要跨計(jì)算單元而造成延遲劇增。這種架構(gòu)效率更高的優(yōu)勢(shì)也是至強(qiáng)在核數(shù)曾落后的情況下還能打的有來(lái)有往的關(guān)鍵原因。

2.DDR5內(nèi)存雙管齊下提升帶寬。至強(qiáng)6900系列支持12通道DDR5 6400,總帶寬可以達(dá)到614GB/s,平均每核的帶寬大致還有5GB/s的水平。6900P還支持新型內(nèi)存MRDIMM,頻率提升至8800MT/s,總帶寬達(dá)到了845GB/s,平均每核6.6GB/s,也明顯超過(guò)了前兩代產(chǎn)品,大幅度逆轉(zhuǎn)了內(nèi)核數(shù)量增加、平均內(nèi)存帶寬不升反降的問(wèn)題。

MR(Multiplexed Rank)DIMM打開(kāi)了DDR內(nèi)存性能提升的新方向。DRAM通常由1到2個(gè)Rank組成,每個(gè)Rank的位寬為64位,如果考慮ECC,那就會(huì)有72或80位,但有效的數(shù)據(jù)是64位。消費(fèi)類內(nèi)存(UDIMM)可能只有1個(gè)Rank(顆粒數(shù)量較少的情況下),但追求大容量的服務(wù)器內(nèi)存(RDIMM)基本上都至少有2個(gè)Rank。在以往的內(nèi)存模式當(dāng)中,一次只讀取一個(gè)Rank的數(shù)據(jù),另一個(gè)Rank暫時(shí)閑置時(shí)可以做刷新操作,以保持?jǐn)?shù)據(jù)——這種輪流讀取、刷新Rank的特點(diǎn)延續(xù)了多年。MRDIMM設(shè)計(jì)了一個(gè)數(shù)據(jù)緩沖區(qū),通過(guò)將兩個(gè)內(nèi)存Rank分別讀入這個(gè)緩沖區(qū),再?gòu)木彌_區(qū)一次性傳輸?shù)紺PU的內(nèi)存控制器,由此實(shí)現(xiàn)了帶寬翻倍。第一代DDR5 MRDIMM的目標(biāo)速率為8800 MT/s,其實(shí)每個(gè)Rank只相當(dāng)于4400MT/s?,F(xiàn)在DDR5 6400已經(jīng)開(kāi)始普及,因此MR DIMM的第二階段目標(biāo)是達(dá)到12800 MT/s,預(yù)計(jì)在2030年代的三代會(huì)提升至17600 MT/s。

3.CXL 內(nèi)存擴(kuò)展。第四代至強(qiáng)可擴(kuò)展處理器開(kāi)始引入CXL支持,當(dāng)時(shí)是1.1版本,暫時(shí)也沒(méi)有公開(kāi)支持Type 3設(shè)備(也就是CXL內(nèi)存)。從第五代開(kāi)始正式引入了CXL 2.0,包括Type 3,可以幫助擴(kuò)展內(nèi)存容量和帶寬。在至強(qiáng)6上,CXL設(shè)備的應(yīng)用將更為普及,關(guān)鍵的CXL2.0標(biāo)準(zhǔn)設(shè)備,以及后向兼容的CXL1.1設(shè)備,預(yù)計(jì)都會(huì)陸續(xù)涌現(xiàn)。

這里重點(diǎn)說(shuō)一下CXL內(nèi)存的優(yōu)勢(shì)。CXL2.0支持鏈路分叉,使一個(gè)主機(jī)端口可以對(duì)接多個(gè)設(shè)備,而且提供更強(qiáng)的CXL內(nèi)存分層支持,可實(shí)現(xiàn)容量和帶寬擴(kuò)展。至強(qiáng)6支持3種CXL內(nèi)存擴(kuò)展模式:CXL Numa Node、CXL Hetero Interleaved、Flat Memory。

CXL Numa Node模式下,系統(tǒng)的標(biāo)準(zhǔn)內(nèi)存和CXL擴(kuò)展內(nèi)存被視為兩個(gè)獨(dú)立的Numa節(jié)點(diǎn)進(jìn)行控制。每個(gè)Numa節(jié)點(diǎn)都有自己的內(nèi)存地址空間,系統(tǒng)軟件或應(yīng)用程序可以將任務(wù)分配到不同的Numa節(jié)點(diǎn),從而優(yōu)化內(nèi)存的使用。CXL Numa Node模式適用于需要精細(xì)內(nèi)存管理的應(yīng)用,可以通過(guò)操作系統(tǒng)、虛擬機(jī)管理程序(Hypervisor)或應(yīng)用程序本身來(lái)輔助分層管理內(nèi)存。

Hetero Interleaved(異構(gòu)交織)模式通過(guò)將系統(tǒng)的標(biāo)準(zhǔn)內(nèi)存和CXL內(nèi)存混合在一起,形成一個(gè)統(tǒng)一的Numa節(jié)點(diǎn)。每個(gè)內(nèi)存地址空間中的數(shù)據(jù)可以交替存儲(chǔ)在DRAM和CXL內(nèi)存中,從而均衡內(nèi)存帶寬,減少延遲。異構(gòu)交織模式適用于對(duì)內(nèi)存帶寬有高需求的應(yīng)用,特別是當(dāng)需要將DRAM和CXL內(nèi)存結(jié)合使用時(shí)。此模式只有在配備性能核的至強(qiáng)6700P、6900P上才支持。假設(shè)將每顆至強(qiáng)6900P的64通道CXL用滿,可以額外增加256GB/s的內(nèi)存帶寬,單處理器就可以實(shí)現(xiàn)TB級(jí)的內(nèi)存帶寬,還是相當(dāng)可觀的。

Flat Memory(平面內(nèi)存)模式下,CXL內(nèi)存和標(biāo)準(zhǔn)內(nèi)存被視為單一的內(nèi)存層,操作系統(tǒng)可以直接訪問(wèn)統(tǒng)一的內(nèi)存地址空間。硬件輔助的分層管理可以確保常用數(shù)據(jù)優(yōu)先存儲(chǔ)在標(biāo)準(zhǔn)內(nèi)存中,次要數(shù)據(jù)存儲(chǔ)在CXL內(nèi)存中,從而最大限度地提升內(nèi)存使用效率。平面內(nèi)存模式最大的價(jià)值在于無(wú)需修改軟件即可利用CXL內(nèi)存擴(kuò)展,而且這種模式適用于所有的至強(qiáng)6處理器。但平面內(nèi)存模式要求標(biāo)準(zhǔn)內(nèi)存和CXL內(nèi)存是1:1配置,這略為限制了硬件采辦、升級(jí)的靈活性。整體而言,平面內(nèi)存模式是至強(qiáng)6時(shí)期最易用、收效最直觀的模式,有望成為CXL內(nèi)存擴(kuò)展的主要模式。

踏上Chiplet異構(gòu)之路

至強(qiáng)6是至強(qiáng)家族首次將計(jì)算和IO芯片獨(dú)立,再通過(guò)Chiplet形式封裝在一起,總算是把高級(jí)封裝的優(yōu)勢(shì)真正發(fā)揮出來(lái)了。

第四代至強(qiáng)可擴(kuò)展處理器是英特爾的首個(gè)Chiplet設(shè)計(jì)的至強(qiáng)處理器。其XCC版本內(nèi)部是4顆芯片通過(guò)10組EMIB對(duì)等連接,每顆芯片提供15個(gè)內(nèi)核、2通道內(nèi)存控制器、1組加速單元,以及UPI、PCIe PHY若干。另外,還可以通過(guò)EMIB封裝4顆HBM。

第五代至強(qiáng)可擴(kuò)展處理器使用2顆芯片封裝而成,所使用的EMIB數(shù)量明顯減少,相應(yīng)地也節(jié)約了芯片面積。雖然內(nèi)核數(shù)量略有增加,但也損失了UPI、PCIe的數(shù)量,也不再能夠搭配HBM。

隨著制造工藝演進(jìn),偏重計(jì)算性能和晶體管密度的處理器內(nèi)核,與偏重高速信號(hào)互聯(lián)的IO控制器對(duì)制造工藝的要求產(chǎn)生了差異,因此,典型的Chiplet設(shè)計(jì)將計(jì)算和IO分離,分別應(yīng)用不同的制造工藝。英特爾在14代酷睿上便采用了這種方式,分為Compute Tile、SoC Tile、IO Tile、Graphic Tile。代號(hào)Ponte Vecchio的英特爾Data Center GPU Max利用Foveros和EMIB技術(shù),將47個(gè)小芯片封裝在一起,包括Compute Die、Base Die、Rambo、IO Die等。

至強(qiáng)6終于也拆分成計(jì)算單元(Compute Tile)和IO單元(IO Tile),分別由Intel 3和Intel 7工藝制造。

計(jì)算單元

根據(jù)收集到的信息,對(duì)于能效核,目前只出現(xiàn)了一種計(jì)算單元的設(shè)計(jì),每個(gè)單元最多提供144個(gè)內(nèi)核、4組內(nèi)存控制器共八通道;對(duì)于性能核,則是有三種計(jì)算單元的設(shè)計(jì),可分別用于組合高核數(shù)、中等核數(shù)、低核數(shù)的規(guī)格。

至強(qiáng)6900P使用了三個(gè)計(jì)算單元,每個(gè)單元43個(gè)內(nèi)核、兩個(gè)內(nèi)存控制器,總共構(gòu)成129個(gè)內(nèi)核(只使用128個(gè))和12個(gè)內(nèi)存通道。這種計(jì)算單元姑且稱之為單元A,三個(gè)單元A構(gòu)成的處理器被稱為UCC。

未來(lái)發(fā)布的6700P核數(shù)跨度會(huì)很大,其中單路型號(hào)規(guī)劃為16~80核,多路型號(hào)為8~86核。單元A有4個(gè)內(nèi)存通道,兩個(gè)單元A組合可以提供最高86核,下限應(yīng)該不低于48核(否則屏蔽的內(nèi)核數(shù)量就實(shí)在太多,也太浪費(fèi)EMIB成本),這種規(guī)模的處理器被稱為XCC。48核以下的中等核數(shù)被稱為HCC,使用一種專門(mén)開(kāi)發(fā)的單元B,每個(gè)單元提供48個(gè)內(nèi)核和4個(gè)內(nèi)存控制器。HCC核數(shù)的下限預(yù)計(jì)在24核左右。8和16核的6700P被稱為L(zhǎng)CC,需要使用第三種單元C,16個(gè)內(nèi)核和4個(gè)內(nèi)存控制器。

通過(guò)使用3種計(jì)算單元進(jìn)行組合,至強(qiáng)6性能核可以構(gòu)建跨度從8~128核的、非常綿密的規(guī)格。也許會(huì)有人認(rèn)為,相比其他廠商只用一種規(guī)格計(jì)算單元實(shí)現(xiàn)擴(kuò)展的設(shè)計(jì),英特爾需要設(shè)計(jì)三顆不同的芯片的成本會(huì)更高。但我認(rèn)為,這是英特爾優(yōu)先考慮性能的結(jié)果。首先,至強(qiáng)6將內(nèi)存控制器安排在計(jì)算單元中,離內(nèi)核更近,延遲更低,即使因此犧牲了單元組合使用的靈活性也是值得的。其次,至強(qiáng)6性能核給不同規(guī)模的內(nèi)核數(shù)量規(guī)劃不同的網(wǎng)格規(guī)模,有利于降低核間的延遲,甚至,有可能LCC會(huì)針對(duì)較低的核數(shù)改用環(huán)形總線。綜上,預(yù)計(jì)至強(qiáng)6性能核相對(duì)同等規(guī)模的其他廠商的產(chǎn)品依舊可能會(huì)擁有內(nèi)存延遲低、緩存延遲低的優(yōu)勢(shì)。

IO單元

IO單元方面,至強(qiáng)6900、6700系列都使用2顆相同的IO芯片。每個(gè)IO芯片由2個(gè)IO模塊、4個(gè)UIO模塊、2個(gè)加速器模塊,以及IO網(wǎng)絡(luò)接口構(gòu)成。每個(gè)IO模塊提供x16 PCIe或CXL連接;每個(gè)UIO模塊提供x24 UPI2.0,或復(fù)用為x16的PCIe或CXL;每個(gè)加速器模塊提供DSA、IAA、QAT、DLB加速器各一個(gè)。

以這次發(fā)布的至強(qiáng)6900P為例,兩個(gè)IO單元總共提供8個(gè)UIO和4個(gè)IO模塊。其中6組UIO負(fù)責(zé)提供6個(gè)UPI2.0互連,剩余的2個(gè)UIO和4個(gè)IO模塊正好提供6×16=96通道的PCIe 5.0。雙路至強(qiáng)6900P的UPI不但速率高(24GT/s,高于五代的20GT/s和四代的16GT/s),連接數(shù)量也提升了50%。

對(duì)于還未發(fā)布、也是主力產(chǎn)品的至強(qiáng)6700系列,估計(jì)由于要使用規(guī)模較小的插座,只提供最多4組UPI用于多路的互聯(lián),PCIe通道也有所縮減。但即使如此,至強(qiáng)6700系列的單路型號(hào)在將所有UIO配置為PCIe之后,單插槽就可以提供多達(dá)136個(gè)PCIe通道,或64通道CXL。如果用單路至強(qiáng)6700配合半寬主板構(gòu)建雙節(jié)點(diǎn)服務(wù)器,那一個(gè)機(jī)箱內(nèi)的PCIe/CXL擴(kuò)展能力(272 /128)遠(yuǎn)遠(yuǎn)超過(guò)已知的任何雙路服務(wù)器。這種機(jī)箱可能會(huì)成為新的池化形態(tài),可以更高的密度提供NVMe存儲(chǔ)、CXL內(nèi)存、加速器等。

結(jié) 語(yǔ)

由于英特爾在14nm到10nm制造工藝的迭代過(guò)程遇到了一些問(wèn)題,以致此前幾代至強(qiáng)平臺(tái)在“核戰(zhàn)”(比拼核數(shù))中略顯被動(dòng),但這個(gè)局面在至強(qiáng)6上有望完全逆轉(zhuǎn)。改良后的EUV制造工藝看來(lái)沒(méi)有束縛至強(qiáng)6的實(shí)力,核心數(shù)量、緩存容量、內(nèi)存帶寬等關(guān)鍵指標(biāo)全都進(jìn)入領(lǐng)先行列,一句話總結(jié)就是算力和存力的表現(xiàn)全部拉滿。至強(qiáng)6900P系列在各種項(xiàng)目的測(cè)試當(dāng)中,其代際性能提升就都是以倍數(shù)計(jì),而非百分之十幾、幾十的進(jìn)步。這種形勢(shì)也使得英特爾得以全面競(jìng)爭(zhēng)科學(xué)計(jì)算、大數(shù)據(jù)、AI等領(lǐng)域的性能王座。

此外,至強(qiáng)6終于實(shí)現(xiàn)計(jì)算與IO的解耦,也讓至強(qiáng)6及未來(lái)的產(chǎn)品線走上了正確、靈活的道路,得以充分發(fā)揮Chiplet的優(yōu)勢(shì)。將Chiplet視作降低成本、提高良率的手段是狹隘的。Chiplet的價(jià)值在于靈活、復(fù)用、重構(gòu)。英特爾長(zhǎng)期以來(lái)很注重細(xì)分市場(chǎng)的耕耘,產(chǎn)品線非常復(fù)雜,正確利用Chiplet可以達(dá)到事半功倍的效果。我們非常期待至強(qiáng)6后續(xù)產(chǎn)品的陸續(xù)發(fā)布能夠給業(yè)界帶來(lái)什么樣的想象力。

點(diǎn)贊()
上一條:延遲退休不焦慮!用芳華未來(lái)app快樂(lè)養(yǎng)生,安享健康晚年2024-09-27
下一條:聯(lián)通情,人心通:一線服務(wù)者的溫暖傳遞2024-09-27

相關(guān)稿件

增加算力供給 上海臨港算力產(chǎn)業(yè)規(guī)模指向百億級(jí) 2023-06-03
AI催生算力需求爆發(fā) 算網(wǎng)“高速路”加快鋪就 2023-08-21
湖南著力建設(shè)全國(guó)先進(jìn)綠色算力樞紐 2023-09-18
工信部多舉措夯實(shí)數(shù)字經(jīng)濟(jì)“算力底座” 2022-06-30
打造長(zhǎng)三角算力產(chǎn)業(yè)新坐標(biāo) 2022-02-23
國(guó)務(wù)院國(guó)有資產(chǎn)管理委員會(huì) 中國(guó)企業(yè)聯(lián)合會(huì) 中國(guó)企業(yè)報(bào) 中國(guó)社會(huì)經(jīng)濟(jì)網(wǎng) 中國(guó)國(guó)際電子商務(wù)網(wǎng) 新浪財(cái)經(jīng) 鳳凰財(cái)經(jīng) 中國(guó)報(bào)告基地 企業(yè)社會(huì)責(zé)任中國(guó)網(wǎng) 杭州網(wǎng) 中國(guó)產(chǎn)經(jīng)新聞網(wǎng) 環(huán)球企業(yè)家 華北新聞網(wǎng) 和諧中國(guó)網(wǎng) 天機(jī)網(wǎng) 中貿(mào)網(wǎng) 湖南經(jīng)濟(jì)新聞網(wǎng) 翼牛網(wǎng) 東莞二手房 中國(guó)經(jīng)濟(jì)網(wǎng) 中國(guó)企業(yè)網(wǎng)黃金展位頻道 硅谷網(wǎng) 東方經(jīng)濟(jì)網(wǎng) 華訊財(cái)經(jīng) 網(wǎng)站目錄 全景網(wǎng) 中南網(wǎng) 美通社 大佳網(wǎng) 火爆網(wǎng) 跨考研招網(wǎng) 當(dāng)代金融家雜志 借貸撮合網(wǎng) 大公財(cái)經(jīng) 誠(chéng)搜網(wǎng) 中國(guó)鋼鐵現(xiàn)貨網(wǎng) 證券之星 融易在線 2014世界杯 中華魂網(wǎng) 納稅人俱樂(lè)部 慧業(yè)網(wǎng) 商界網(wǎng) 品牌家 中國(guó)國(guó)資報(bào)道 金融界 中國(guó)農(nóng)業(yè)新聞網(wǎng) 中國(guó)招商聯(lián)盟 和訊股票 經(jīng)濟(jì)網(wǎng) 中國(guó)數(shù)據(jù)分析行業(yè)網(wǎng) 中國(guó)報(bào)道網(wǎng) 九州新聞網(wǎng) 投資界 北京科技創(chuàng)新企業(yè)誠(chéng)信聯(lián)盟網(wǎng) 中國(guó)白銀網(wǎng) 炣燃科技 中企媒資網(wǎng) 中國(guó)石油化工集團(tuán) 中國(guó)保利集團(tuán)公司 東風(fēng)汽車(chē)公司 中國(guó)化工集團(tuán)公司 中國(guó)電信集團(tuán)公司 華為技術(shù)有限公司 廈門(mén)銀鷺食品有限公司 中國(guó)恒天集團(tuán)有限公司 濱州東方地毯集團(tuán)有限公司 大唐電信科技股份有限公司 中國(guó)誠(chéng)通控股集團(tuán)有限公司 喜來(lái)健醫(yī)療器械有限公司 中國(guó)能源建設(shè)股份有限公司 內(nèi)蒙古伊利實(shí)業(yè)集團(tuán)股份有限公司 中國(guó)移動(dòng)通信集團(tuán)公司 中國(guó)化工集團(tuán)公司 貴州茅臺(tái)酒股份有限公司