芯片背后的故事:打造、測試“無(wú)所不能”的服務(wù)器芯片
有時(shí)候,提高績(jì)效的方法不是賦予更多的權力或能力,而是減少冗雜的工作量,使其專(zhuān)注于最擅長(cháng)的事情。
本文引用地址:http://dyxdggzs.com/article/202302/443214.htm與其讓才華橫溢的主廚洗菜、切菜,不如給她雇個(gè)幫手,讓她花更多的時(shí)間烹飪美食。這樣,你將獲得品質(zhì)更高、也更具創(chuàng )意的佳肴。
英特爾高級院士兼至強總工程師Nevine Nassif介紹道,同理,對于全新的第四代英特爾?至強?可擴展處理器來(lái)說(shuō),“主廚”相當于微處理器的內核,而“助手”則是芯片上的專(zhuān)用加速器。
Nassif表示:“你不會(huì )希望這些功能強大的多用途內核耗費大量時(shí)間去做簡(jiǎn)單的壓縮加密算法或遷移數據——內置加速器可以更快、更高效地完成這些工作,同時(shí)釋放內核來(lái)完成更重要的任務(wù)?!?/p>
其直觀(guān)結果就是產(chǎn)品性能效率的飛躍。當加速器成為處理工作的一部分時(shí),英特爾1月發(fā)布的第四代至強可擴展處理器(代號“Sapphire Rapids”)的每瓦性能幾乎是前代產(chǎn)品的3倍1。
總工程師的首要任務(wù):將想法轉化為芯片
巨大的收獲源自多年的積累。作為總工程師,Nassif從頭到尾見(jiàn)證了這一切。
首先,由首席架構師根據市場(chǎng)和技術(shù)專(zhuān)家的意見(jiàn)及專(zhuān)業(yè)知識勾勒出芯片的功能,隨后總工程師組隊確定能否、以及如何構建、測試并交付這些功能。
這就類(lèi)似行政總廚或酒店老板要求廚師長(cháng)在菜單上的法式海鮮燉菜上加點(diǎn)新花樣——即便這個(gè)要求已經(jīng)足夠明確了,但廚師長(cháng)仍需要弄清楚實(shí)際的配料和流程,才能持續穩定地出品大量完美的菜肴。
早期的任務(wù)是利用可用的人才、工具和時(shí)間,將架構轉化為實(shí)際設計。其后隨著(zhù)產(chǎn)品的出現,這個(gè)角色逐漸轉變?yōu)橹饕膯?wèn)題解決者、協(xié)調者和傾聽(tīng)者。
Nassif強調:“我是一個(gè)非常樂(lè )觀(guān)的人,所以,我需要確保身邊有足夠多的人可以告訴我壞消息,讓我回到現實(shí)中,這點(diǎn)非常重要?!边@也意味著(zhù)團隊需要接受來(lái)自各個(gè)方面的新想法。
“有些事情我非常了解,但也有很多事情我并不了解。我依靠其他團隊伙伴來(lái)幫助我解決問(wèn)題,同時(shí)幸運的是,我身邊確實(shí)有一群非常優(yōu)秀的人?!?/p>
Nassif在至強芯片開(kāi)發(fā)過(guò)程中求助于眾多“副廚”,他們是來(lái)自芯片特定領(lǐng)域、制造和組裝、測試和驗證,以及全公司眾多其他領(lǐng)域的專(zhuān)家。
掃清障礙,打造即插即用的芯片
不同于以往,Sapphire Rapids項目極具挑戰性。該產(chǎn)品為英特爾首次引入了多項技術(shù)和制造工藝,如全新內存、接口及加速器等。這也是首次通過(guò)將多個(gè)晶片組合在一個(gè)封裝上來(lái)打造至強芯片,之前曾被稱(chēng)為“像縫被子一樣做芯片”。
Nassif指出:“我們始終致力于能夠實(shí)現芯片大規模的即插即用,即一個(gè)芯片由多個(gè)單獨調優(yōu)的芯粒組成。通過(guò)把特定的新或是更新的芯粒與經(jīng)過(guò)驗證、現成可用的芯?;旌显谝黄鹩糜诔R幑δ?,可以更快推出全新且種類(lèi)豐富的芯片。
Nassi表示:“Sapphire清除了技術(shù)上的障礙?!钡谒拇翉娬狭怂膫€(gè)相同的芯粒,把總體能力提升至新水平,基本上實(shí)現了即插即用的目標。換句話(huà)說(shuō),它采用了所有可能的選項來(lái)提高性能,即在引入新 “廚房助理”的同時(shí),也加入了更多“主廚”。
掃清障礙不僅意味著(zhù)要了解制造流程,也需要深諳測試詳情。然而,隨著(zhù)現代數據中心規模的不斷擴大,上述流程也日益復雜化。Nassif認為:“客戶(hù)常會(huì )以意想不到的方式應用我們的產(chǎn)品,這也會(huì )時(shí)常讓我們感到驚訝?!?/p>
在大型云數據中心中的至強處理器幾乎從不休息,始終在不停歇地處理各種應用。
發(fā)現舊bug和新限制
客戶(hù)會(huì )以新的方式推廣過(guò)往的產(chǎn)品,在推廣過(guò)程中偶爾會(huì )發(fā)現bug,如簡(jiǎn)單的打字錯誤、兩個(gè)不相關(guān)組件之間的電氣干擾等,而這些bug可能也存在于新處理器中。Nassif指出:“只要我們了解到反饋,就會(huì )去查看。反思為什么會(huì )有疏漏?如何才能改變?”
Nassif解釋道,團隊將在多代產(chǎn)品中運行新的測試,現有的測試將在產(chǎn)品生命周期的每個(gè)步驟中進(jìn)行檢查并隨之改進(jìn)。她指出:“為盡早發(fā)現漏洞,我們一直在努力學(xué)習?!?/p>
隨著(zhù)項目并行開(kāi)展,Nassif也是Sapphire Rapids后續產(chǎn)品Emerald Rapids的總工程師,因此可以汲取經(jīng)驗教訓。
Nassif表示:“工程是極具創(chuàng )造性的,相當大一部分是藝術(shù)?!?/p>
隨著(zhù)每一個(gè)新挑戰的克服、每一個(gè)錯誤的解決,以及流程、工具和人員的改進(jìn),藝術(shù)變成了科學(xué)。但他們深知,下一個(gè)挑戰依然近在眼前。
Nassif表示:“為了實(shí)現目標,你必須接受?chē)L試新事務(wù)、并坦然面對失敗。這條路上沒(méi)有魔法,只有堅持按照想法去實(shí)踐才能抵達終點(diǎn)?!?/p>
1 參見(jiàn)[E1]intel.com/processorclaims:第四代英特爾?至強?可擴展處理器。結果可能有所不同。
評論