Intel 14nm末代服務(wù)器增加新指令 10nm又砍掉
Intel近日發(fā)布了第二代可擴展至強處理器,代號為Cascade Lake,工藝還是14nm,架構還是Skylake-SP,而接下來(lái)在明年,Intel還將再拿出一代14nm服務(wù)器平臺,代號為Cooper Lake,而且很可能更換接口和主板,再往后才輪到10nm Ice Lake。
本文引用地址:http://dyxdggzs.com/article/201904/399247.htmCascade Lake在機器學(xué)習、人工智能方面做了顯著(zhù)增強,Cooper Lake則會(huì )繼續改進(jìn)。根據Intel發(fā)布的最新版開(kāi)發(fā)者文檔,Cooper Lake會(huì )引入新的AVX512_BF16適量神經(jīng)網(wǎng)絡(luò )指令,也就是支持bfloat16(BF16)格式。
bfloat16(BF16)浮點(diǎn)格式介于標準化的半精度FP16、單精度FP32之間,指數位和FP32一樣而多于FP16,但是小數位比FP16更少。
它能讓開(kāi)發(fā)者在16位空間內通過(guò)降低精度來(lái)獲取更大的數值空間,在內存中存放更多數據,減少數據進(jìn)出空間的時(shí)間,還能降低電路復雜度,最終帶來(lái)計算速度的提升。
這種格式已經(jīng)成為深度學(xué)習事實(shí)上的標準,Google TPU、Intel未來(lái)的FPGA及其N(xiāo)ervan神經(jīng)網(wǎng)絡(luò )處理器都會(huì )支持,Xeon至強家族支持也在情理之中。
Cooper Lake支持的AVX512-BF16指令包括VCVTNE2PS2BF16、VCVTNEPS2BF16、VDPBF16PS,而且都有128位、256位、512位三種模式,因此開(kāi)發(fā)者可以根據需要選擇九種不同版本。
不過(guò)奇怪的是,Intel每次公布新指令的時(shí)候,都會(huì )確認支持的首個(gè)架構以及此后支持的架構,比如最初的AVX指令集,支持的架構就標注為“Sandy Bridge and later”。
但這次,AVX512-BF16指令的支持架構卻只寫(xiě)著(zhù)“Future Cooper Lake”,并沒(méi)有看到慣例的“and later”。
這似乎意味著(zhù),只有14nm Cooper Lake才會(huì )支持AVX512-BF16,而接下來(lái)的10nm Ice Lake反而會(huì )砍掉。
Intel對此回應稱(chēng):“目前,Cooper Lake會(huì )為機器學(xué)習加速(DLBoost)加入Bfloat16指令。除此之外在路線(xiàn)圖內沒(méi)有可分享的?!?/p>
評論