如何利用芯片數據提高生產(chǎn)力?
半導體生態(tài)系統正爭先恐后地更有效地使用數據,以提高設計團隊的生產(chǎn)力、提高晶圓廠(chǎng)的產(chǎn)量,并最終提高現場(chǎng)系統的可靠性。
本文引用地址:http://dyxdggzs.com/article/202302/443795.htm數據收集、分析和利用是所有這些工作以及更多工作的核心??梢栽趶脑O計到制造流程中的每個(gè)點(diǎn)收集數據并進(jìn)入現場(chǎng),并且可以將其循環(huán)回當前和未來(lái)的設計中以防止代價(jià)高昂的故障,或者向前推進(jìn)以防止軟件和硬件之間不必要的交互。
「當我們查看現場(chǎng)數據以及新代工廠(chǎng)/晶圓廠(chǎng)啟動(dòng)過(guò)程中發(fā)生的事情時(shí),我們已經(jīng)看到他們如何在每個(gè)芯片上創(chuàng )建大量數據以確定如何提高產(chǎn)量」, Cadence 數字與簽核集團產(chǎn)品管理副總裁 Kam Kittrell 說(shuō)?!高@一直是一個(gè)大數據問(wèn)題,其中涉及很多深奧的事情——如何提高產(chǎn)量和可制造性設計。它正在獲取大數據,對其進(jìn)行分析,研究如何調整正在發(fā)生的事情,以便在未來(lái)獲得更好的收益。這正是流程節點(diǎn)開(kāi)發(fā)。但現在它向下游走得越來(lái)越遠,因為我們希望能夠進(jìn)行系統級測試,因為超大規模公司正在將非常復雜的云系統與數千臺計算機放在一起,并使用這些完全相同的計算機構建數千個(gè)站點(diǎn)?!?/span>
讓系統、軟件和硬件的組合協(xié)同工作是一個(gè)巨大的挑戰,從測試芯片收集現場(chǎng)數據并將其反饋到設計到制造流程中可以顯著(zhù)提高生產(chǎn)芯片和系統的產(chǎn)量?!溉绻麄兞私饬擞嘘P(guān)芯片的一些信息,他們就可以在下游進(jìn)行測試,看看是否會(huì )立即出現故障,」Kittrell 說(shuō)?!改悴幌朐谠浦刑幚砜蛻?hù)的有效載荷,然后看到它失敗了,然后你發(fā)現了一些你可以從芯片測試中知道的東西?!?/span>
其他人同意?!高@里正在發(fā)生的大趨勢是產(chǎn)品的復雜性,」是德科技新市場(chǎng)高級經(jīng)理兼數字孿生項目經(jīng)理 Chris Mueth 說(shuō)?!高@是最大的驅動(dòng)力。你可以說(shuō)有一些監管標準和小型化正在進(jìn)行,但這實(shí)際上都是關(guān)于復雜性的,而且它只會(huì )變得越來(lái)越糟,因為消費者想要更多的功能在他們的手中。開(kāi)發(fā)人員將繼續向產(chǎn)品中添加越來(lái)越多的功能?!?/span>
想想 15 年前的 2.5G 移動(dòng)芯片?!甘謾C中的 PA 芯片可能有 100 項要求,」Mueth 說(shuō)?!脯F在它是一款多功能 5G 芯片,可以滿(mǎn)足 2000 項要求。它可能有多個(gè)波段。它必須在多種電壓下以多種工作模式運行,并且所有這些都必須進(jìn)行管理和驗證。我們聽(tīng)說(shuō)過(guò)芯片制造商錯過(guò)驗證需求的故事,只有在它已經(jīng)在手機芯片中時(shí)才發(fā)現它?!?/span>
而這只是故事的一部分。所有這些都需要在可能影響整個(gè)系統的變化的背景下進(jìn)行查看,因此需要端到端地收集和分析數據。
英飛凌軟件和生態(tài)系統副總裁 Rob Conant 表示:如果你是一家生產(chǎn)聯(lián)網(wǎng)設備的傳統公司,你會(huì )進(jìn)行用戶(hù)研究和焦點(diǎn)小組討論的連接安全系統業(yè)務(wù)部門(mén)?!改阌盟鼇?lái)告知你未來(lái)的產(chǎn)品方向。在物聯(lián)網(wǎng)領(lǐng)域,他們真的沒(méi)有全心全意地進(jìn)入那個(gè)模型。這是對這些產(chǎn)品的事后補充。但是,其他產(chǎn)品的構建以連接性為核心。家庭安全系統就是一個(gè)很好的例子。它有一個(gè)非常具體的價(jià)值主張和一個(gè)非常具體的客戶(hù),一個(gè)有形的客戶(hù)可交付成果。連通性是該可交付成果的核心。對于提供這些服務(wù)和解決方案的公司而言,重要的不是包裝在他們相機上的吸引力。這是關(guān)于他們能夠以多經(jīng)濟和多有意義的方式提供特定的客戶(hù)價(jià)值,因此他們更加積極地使用數據來(lái)了解他們的產(chǎn)品如何運作,他們的客戶(hù)如何使用這些產(chǎn)品,以及這些產(chǎn)品如何與客戶(hù)價(jià)值聯(lián)系起來(lái)。這種客戶(hù)成功的想法在某種程度上存在于消費類(lèi)硬件中。如果你把它深入到半導體公司本身,這個(gè)想法就會(huì )滲透到像 Infineon 和其他公司這樣的較低級別的組件供應商中,但它并不是本地的。它是我們銷(xiāo)售產(chǎn)品的附加組件?!?/span>
更好的自動(dòng)化
有效地利用數據可以為設計團隊帶來(lái)豐厚的回報。設計復雜性增加與人才短缺之間的鴻溝越來(lái)越大,而數據是縮小這一差距的重要因素。
「任何 EDA 公司都會(huì )在設計和測試上花費大量時(shí)間,但由于正在發(fā)生的大趨勢,數據管理領(lǐng)域出現了一個(gè)新興領(lǐng)域來(lái)處理如何管理所有需求,」Mueth 說(shuō)?!肝以趺粗肋@些要求是否得到滿(mǎn)足?模擬或測試設備以確保其滿(mǎn)足要求的標準是什么?你有需求管理本身嗎?我如何知道芯片中的 IP 在我制造時(shí)是正確的 IP?我使用的工具和版本的可追溯性如何?當您進(jìn)行驗證時(shí),所有這些都很重要。正如你想象的那樣,我正在那里處理大量的數據?!?/span>
反過(guò)來(lái),這些數據可用于改進(jìn)仿真和驗證,并可縮短調試過(guò)程。
「在仿真領(lǐng)域,工程團隊正在執行三項主要任務(wù),」 Imperas 首席執行官 Simon Davidmann 說(shuō)?!敢粋€(gè)是構建可以運行的軟件。他們試圖啟動(dòng)并運行軟件,并擁有他們想要了解的某些數據。二是另一個(gè)極端,工程師們正在圍繞 RISC-V 進(jìn)行驗證。然后是另一群正在尋求提高性能的人。所有這些人都需要不同類(lèi)型的數據?!?/span>
但是工程團隊需要了解他們收集數據的目的以及他們需要什么類(lèi)型的數據。
「這是'什么'和'為什么'?!冈趺醋觥箤τ谖覀児こ處焷?lái)說(shuō)顯然是必需的,因為例如在我們的建模方面,我們是速度很快,」Davidmann 說(shuō)?!肝覀儾幌朐谀P椭屑尤肴魏螘?huì )減慢我們速度的東西。如果你想開(kāi)始分析模型中發(fā)生的事情,它會(huì )減慢它的速度。所以我們非常關(guān)心人們想要什么數據,因為它會(huì )對性能產(chǎn)生影響。然后,當一個(gè)工程團隊想要添加數據分析時(shí),從我們的角度來(lái)看,有幾種類(lèi)型的數據是有用的。首先,他們必須確定他們想要將其用于什么用途以及他們想要的粒度。有些人正在嘗試調整軟件并需要非常具體的數據,例如逐周期數據?;蛘?,如果有人試圖驗證某事,他們將需要與硬件事件等相關(guān)的完全不同的數據。一旦他們獲得了數據,就會(huì )有不同的抽象。例如,如果我們正在幫助工程團隊移植 Linux,他們不想查看 RTL 中的事件。他們甚至不想查看寄存器值。他們想看函數的抽象?;蛘?,他們想查看操作系統中作業(yè)調度程序的抽象。這就是所有可以收集的數據。然后,他們可以對其進(jìn)行分析,看看它的性能如何,或者他們探索了操作系統的哪些部分?!?/span>
確保設備滿(mǎn)足要求是一項巨大的挑戰,這就是為什么估計有三分之二(或更多)的芯片開(kāi)發(fā)用于驗證?!高@里的壓力有很多不同的方式,」Mueth 說(shuō)?!钙渲幸徊糠种皇嵌x我需要的需求,并定義如何模擬或測試這些需求。然后,需要流程定義以及自動(dòng)化構建,因為您可能不會(huì )手動(dòng)完成所有這些工作。您想以自動(dòng)化方式進(jìn)行。然后你必須確定如何收集數據、減少數據并理解數據?!?/span>
更有效地利用數據
數據可能會(huì )因任務(wù)配置文件的不同而有很大差異,這對于汽車(chē)芯片而言與 5G 電話(huà)芯片大不相同,并且它可能會(huì )根據其在流程中的使用方式和位置而有所不同。
「今天我們問(wèn)我們的客戶(hù),'你是否了解你的個(gè)人資料的實(shí)際情況?' 答案或多或少是『不』,這與 HPC 的情況相同,」Synopsys 汽車(chē)硅生命周期解決方案產(chǎn)品經(jīng)理 Pawini Mahajan 說(shuō)。因此,我們試圖通過(guò)硅生命周期管理 (SLM) 做的是在架構級別的設計生命周期早期插入監視器,并在整個(gè)生產(chǎn)生命周期中收集數據,包括在斜坡階段、生產(chǎn)階段、制造階段。我們甚至可以在設備到達現場(chǎng)之前不斷收集數據。所有這些數據都是我們在整個(gè)生命周期中收集的,我們將這些數據作為反饋循環(huán)提供給設計工程師,以進(jìn)一步改進(jìn)下一代設計。但是我們對現場(chǎng)數據所做的工作也可以用于任務(wù)概況。例如,您可以監控任務(wù)概況,或老化和退化。所有這些數據都在收集和填充。
這些數據如何被分割和分析取決于它的用途。其中大部分是使用用戶(hù)為自己的目的創(chuàng )建的內部工具完成的。在某些情況下,數據不完整是因為數據收集受到合同義務(wù)的阻礙。
「這是一個(gè)非常破碎和脫節的區域,」馬哈詹說(shuō)?!该考野雽w公司、一級供應商或 OEM,取決于他們在生命周期中所處的位置,都有自己的解決方案。一些半導體公司可能擁有自己版本的過(guò)程、電壓和溫度監視器,用于從其芯片中收集數據。但是,一旦該芯片進(jìn)入汽車(chē),目前可能還沒(méi)有一種指標可以通過(guò) OEM 的數據湖提取該數據,因為這些合同中不存在某些交互?!?/span>
在設計流程中,最重要的是提高生產(chǎn)力。數據很重要,但往往沒(méi)有得到應有的有效利用。
Synopsys DesignDash 產(chǎn)品經(jīng)理 Mark Richards 表示:「隨著(zhù)設計規模的不斷擴大,挑戰變得如此困難,以至于他們沒(méi)有時(shí)間進(jìn)行他們想要進(jìn)行的多輪優(yōu)化?!?「這主要是關(guān)于在他們擁有的時(shí)間窗口內完成它,所以無(wú)論 PPA 是什么,無(wú)論他們最終采用何種治療方法,他們最終都會(huì )采用。隨著(zhù)這些設計變得越來(lái)越大,迭代時(shí)間越來(lái)越長(cháng),他們試圖做的只是以某種方式提高生產(chǎn)力。數據是達到目的的一種手段,他們將采取目前可以找到的最佳手段來(lái)實(shí)現這一目標?!?/span>
如果收集和分析了正確的數據,它可以用來(lái)顯著(zhù)改進(jìn)優(yōu)化。理查茲說(shuō):「如果我們能夠開(kāi)始以一種他們可以有效吸收它的方式向用戶(hù)展示它,那將有助于推動(dòng)并提高生產(chǎn)力?!?「我們如何利用所有這些引擎,使用引擎蓋下的方法能夠以比從日志文件中獲得的更細粒度的級別讀取引擎?然后我們可以開(kāi)始合并該數據,并嘗試在其中找到模式。如果我們可以提取這些模式,我們就可以開(kāi)始將它們視為因果關(guān)系、相關(guān)性或介于兩者之間。這有助于工程師更有效地完成工作,這正是他們最終想要達到的目標?!?/span>
一旦芯片制造并通過(guò)測試,它就可以用于硬件/軟件啟動(dòng)?!讣僭O硅質(zhì)量好并且是已知的好芯片,你想(取決于應用程序)添加第一級軟件,例如軟件內核,然后對其進(jìn)行測試,」高級主管 Vivek Chickermane 說(shuō)。Siemens Digital Industries Software 的 Tessent 嵌入式分析研發(fā).「然后你把它放在下一個(gè)層次上,這可能是操作系統微服務(wù),然后是完整的操作系統,也許還會(huì )添加一些應用程序。您構建軟件堆棧,并在實(shí)驗室中進(jìn)行盡可能多的測試。在那里,工程師們真的很想在現場(chǎng)部署之前識別和調試問(wèn)題,他們緊緊關(guān)注幾個(gè)問(wèn)題。例如,如果系統是單芯片,它可能會(huì )使用以前從未使用過(guò)且從未在硅片中得到驗證的 IP。您顯然想驗證這一點(diǎn)。下一個(gè)級別是添加內核或操作系統等。我們可能不確定其生態(tài)系統有多強大。編譯器、內核服務(wù)、微服務(wù)有多好?你想確保所有這些都運作良好。然后你想檢查軟件是否會(huì )按預期運行,
一旦設計團隊達到調試目標并且硬件/軟件協(xié)同設計被認為是好的,他們就可以從實(shí)驗室轉移到現場(chǎng)。這帶來(lái)了一系列完全不同的挑戰。
「該領(lǐng)域存在很多不確定性和不可預測性,因為您無(wú)法始終確保將要在該領(lǐng)域使用的所有軟件以前都曾嘗試過(guò),」奇克曼說(shuō)?!讣僭O你買(mǎi)了一部手機,現在你要添加一個(gè)稍后開(kāi)發(fā)的應用程序。芯片供應商尚未測試該應用程序?,F在想象一下,這是一個(gè)很大的系統,里面有各種需求復雜的應用。這是一組完全不同的問(wèn)題。在現場(chǎng),挑戰是如何構建一個(gè)非??煽亢涂深A測的系統,尤其是當您有很多動(dòng)態(tài)組件時(shí)?我如何從不太可靠和不太可預測的組件構建它?可靠性與設計不當的硅無(wú)關(guān)。就是硅還沒(méi)有被 100% 證明。您可能有 95% 的信心發(fā)布它。所以仍然存在不確定性,這在該領(lǐng)域受到了壓力?!?/span>
有效使用數據對于縮小差距至關(guān)重要,無(wú)論是涉及匯總數據還是監控數據。
「有了聚合數據,我可能想運行一個(gè)應用程序,看看有多少緩存未命中或發(fā)生了多少浮點(diǎn)運算,」他說(shuō)?!甘‰娔J绞欠駟?dòng),啟動(dòng)了多少次?該系統是根據該聚合數據設計的,因為許多指標(如電池壽命或 CPU 利用率)都依賴(lài)于它。該數據來(lái)自性能計數器。另一方面,監測數據更加全面。性能計數器提供聚合數據,而監視器提供時(shí)間敏感數據,因此有時(shí)間差。假設您決定每 100 微秒收集一次數據,因此每 100 微秒就是一個(gè)時(shí)間差。例如,我們的用戶(hù)想要所謂的指令跟蹤。他們想知道當時(shí)正在執行什么指令。如果它是總線(xiàn)監視器,那么它會(huì )查看總線(xiàn)上發(fā)生的事務(wù)。CPU 正在與內存通信嗎?是在和網(wǎng)絡(luò )對話(huà)嗎?是在和 I/O 對話(huà)嗎?」
數據的力量
擁有數據是一回事。以可以在設計中產(chǎn)生重大差異的方式應用它是一個(gè)巨大的飛躍,這會(huì )轉化為消費者的價(jià)值。
「如果你看看像 Apple 這樣的公司,他們擁有大量關(guān)于蜂窩連接的信息,」Infineon 的 Conant 說(shuō)?!阜涓C連接在哪里工作?它在哪里不起作用?為什么它有效?為什么它在不同的地方不起作用?客戶(hù)如何使用該產(chǎn)品?功耗如何根據 MCU 的使用方式而變化?他們?yōu)樵撌謾C設計自己的核心或編寫(xiě)自己的核心芯片組的能力在很大程度上取決于他們擁有的數據的豐富性,這些數據提供了對使用模型的洞察力?!?/span>
真正的價(jià)值來(lái)自于對不同用例的深入理解,以及利用數據為這些用例構建產(chǎn)品的能力?!溉绻憧纯词褂盟麄兊男酒氖謾C的性能,那是非常好的,因為他們對使用模型有深刻的理解,」科南特說(shuō)?!高@些芯片的設計是由這些數據和對它的深刻理解驅動(dòng)的。這是半導體公司需要追求的目標——深入了解其產(chǎn)品的使用模型。但今天,他們往往敬而遠之?!?/span>
評論