超越“降額” 值得現代工程師參考的可靠性概念
“可靠性”這個(gè)詞匯對于不同的人士來(lái)說(shuō)可能有著(zhù)不同意義,但廣泛來(lái)講,底線(xiàn)往往在于成本。可靠性能夠滿(mǎn)足人的期望,它可能基于廣告宣傳、技術(shù)規格或合同,也可能與工程師以外的很多人士息息相關(guān)。例如在社會(huì )經(jīng)濟學(xué)的層面上,我們的生態(tài)系統以道德及倫理為基礎。雖然工程師必須遵守雇主定下的行為標準,但是從個(gè)人品德的立場(chǎng)而言,道德規范可能比經(jīng)濟效益更加重要。歷史常常告訴我們,任何文明都不能單憑經(jīng)濟基礎而持久。完整的可靠性概念才是關(guān)鍵所在。
隨著(zhù)人們逐漸關(guān)注到產(chǎn)品制造和棄置對環(huán)境帶來(lái)的影響,消費者的目光也由最低采購成本轉移到最低擁有成本。無(wú)金錢(qián)或環(huán)境處罰而頻繁更換低質(zhì)量產(chǎn)品的年代已經(jīng)一去不復返。相反,講求可靠性的設計在今天的價(jià)值生態(tài)系統中變得尤為重要。
故障模式與機制
要達到令人滿(mǎn)意的可靠性,便需要對故障模式與機制有充分的理解。故障模式說(shuō)明了一個(gè)零件如何失效,也就是造成故障的“應力”。故障機制反映了零件的強度如何在不同的應力下被減弱。透過(guò)故障模式分析,我們可以歸納出故障的成因,從而改善產(chǎn)品的可靠性;明白了故障的機制后,我們又懂得選擇合適的鑒定試驗去驗證某項應用的可靠性。
故障模式的分類(lèi)如下:
* 電氣性
* 災難性(破壞性)
* 功能性 – 元件不能夠提供正確的輸出數據或信號
* 參量性 – 電流或電壓超出允許誤差
* 編程 – 非揮發(fā)性記憶體元件不能夠做出正常響應
* 時(shí)序 – 例如由于傳播延遲、讀/寫(xiě)時(shí)間、升降時(shí)間及建立時(shí)間不符合規格而造成故障
* 機械性 – 例如引線(xiàn)受損、封裝破裂、污染
* 外觀(guān) – 例如標記難以辨認
* 行政管理 – 例如產(chǎn)品、數量、封裝、方向、日期和代碼出現錯誤
故障機制的分類(lèi)如下:
* 物理故障
* 與時(shí)間有關(guān)的介質(zhì)擊穿
* 負偏壓溫度不穩定
* 電子漂移
* 熱載流子注入
* 輻射故障 (反應器、空間)
* 中子
* Beta粒子
* 伽馬
分析和預測
可用信息能夠估算出故障概率,卻無(wú)法提供實(shí)際故障數據,這是實(shí)施可靠性工程的一大挑戰。一般來(lái)說(shuō),用上幾千小時(shí)去測試一個(gè)裝置的做法是不切實(shí)際的,所以我們通常無(wú)法得到一個(gè)元件或系統在實(shí)際壽命中的測試數據。新產(chǎn)品的可靠性數據往往等于零,然而這并不代表有關(guān)產(chǎn)品永遠不會(huì )出現故障。雖然以更高溫度加快壽命測試或許能提供恰如其分的實(shí)驗數據,不過(guò)該實(shí)驗前提包括了活化能量恒久不變的假設,而在實(shí)際情況下,它是電壓和溫度的一個(gè)函數 (圖1)。這限制了加快的壽命測試在預測可靠性方面的準確度。因此,現場(chǎng)故障的監察及反饋對提高產(chǎn)品可靠性的預測能力十分重要。
圖1
圖2
圖2顯示了在某時(shí)段內的累積故障。這個(gè)概念在常用的產(chǎn)品故障曲線(xiàn) (又稱(chēng)浴盆曲線(xiàn)) 中得到進(jìn)一步的展示 (圖3)。有關(guān)曲線(xiàn)包含3個(gè)清晰的區段,每個(gè)區段都包含了若干有可能造成故障的因素,也牽涉某些人士。他們可以因為某些行動(dòng)而影響了客戶(hù)對可靠性的理解。
第1個(gè)區段描述了裝置的失敗率。只要在生產(chǎn)裝置中進(jìn)行若干測試,就可以把故障率降低到一個(gè)在實(shí)際運行中可以接受的水平。第2個(gè)區段描述了實(shí)際工作壽命中有可能出現的隨機故障。它們與時(shí)間無(wú)關(guān),有關(guān)裝置也不會(huì )預先替換,一般都會(huì )在發(fā)生故障時(shí)才會(huì )被替換。第3個(gè)區段顯示了裝置的壽命接近終結而開(kāi)始出現損耗。假如不加以替換,有一半產(chǎn)品都會(huì )在壽命中期開(kāi)始失效。
圖3
可靠性組合
故障率 (可靠性的一種指標) 已不單單與電氣或熱應力有關(guān),同時(shí)也與硬件、軟件/邏輯及傳輸媒體相互影響。降額是指在制造廠(chǎng)商針對環(huán)境或使用情況而定出的最大限制下對元件施加應力的做法,而該做法已不再是加強可靠性的良方妙法。它只是在最廣泛的程度上有條不紊控制產(chǎn)品質(zhì)量的一種要素。
這方面的最大挑戰,是只能夠在同一段時(shí)間內一個(gè)元件降額;而且由于制造廠(chǎng)商的數據冊逐漸變成了只提供“最低定義”的責任文件,設計員必須在元件中內置額外的緩沖 – 這不但增加了成本,還有可能降低產(chǎn)品的性能表現。
高可靠性產(chǎn)品 (軍事及宇航) 一般都會(huì )使用獨立鑒定的零件。不過(guò),這樣不但增加了成本,也拖長(cháng)了產(chǎn)品推出市場(chǎng)的時(shí)間。假如基于可靠性和質(zhì)量來(lái)設計產(chǎn)品,無(wú)疑是更經(jīng)濟實(shí)惠的方法。針對可靠性的設計必須對故障模式有充分了解,同時(shí)選擇成本最少的硬件冗余、軟件控制及傳輸媒體組合,從而達到甚至超越可靠性目標。產(chǎn)品鑒定包括了解故障機制,并且設計出一套完善的鑒定計劃,務(wù)求在限定的成本和時(shí)間內,對有關(guān)可靠性的預測作出精確的驗證。
針對可靠性的設計
可靠性設計是指通過(guò)平衡硬件、固件和軟件分配,務(wù)求以最低成本實(shí)現理想的可靠性表現。工程師應該緊記,硬件的可靠性是在元件壽命終結時(shí)的一個(gè)時(shí)間函數,軟件的可靠性則是一個(gè)成本函數。軟件一般都沒(méi)有耗損機制。
假如要以最少成本、在最短時(shí)間內達到預期的可靠性目標,就必須充分利用設計分析、故障模擬和工程判斷的重要資料。強大的設計技術(shù)包括為易受損元件提供冗余,同時(shí)意識到每個(gè)元件的可靠性都與整體可靠性密不可分。合適的話(huà),可以利用硬件或軟件把監察與控制功能加入元件設計中,為元件提供周全的應力保護。
靈巧的工程設計還會(huì )考慮到終端應用環(huán)境的設計決定。比方說(shuō),一枚導彈與一臺洗衣機的設計需求顯然有著(zhù)天壤之別。導彈要在短時(shí)間內發(fā)揮強大的性能;相反,洗衣機卻需要針對數以百計的運行周期提供最完美的耐久性。兩者的需求在根本上截然不同。
可靠性的增長(cháng)
圖4
如圖4所示,每個(gè)產(chǎn)品壽命周期都包含不同階段的轉變,由原型到開(kāi)發(fā),再由開(kāi)發(fā)到生產(chǎn),過(guò)程中的可靠性會(huì )不斷增長(cháng)。換句話(huà)說(shuō),每項設計在其壽命周期中,可靠性都會(huì )增加,而成本則會(huì )下降。這反映了可靠性的增長(cháng)不單是設計工程師的責任而已。
事實(shí)上,隨著(zhù)可靠性在價(jià)值生態(tài)系統中的角色日趨重要,不論是從事技術(shù)、管理、物流或面向客戶(hù)的人員,都有責任讓可靠性持續增長(cháng) (圖5)。
圖5
評論