輻射對FPGA應用的影響及解決方案
以前很多人認為,半導體器件只會(huì )在太空應用中受到輻射的影響,但是隨著(zhù)半導體工藝的進(jìn)步,很多地面的應用也會(huì )受到輻射的影響。今天,我們會(huì )介紹不同的輻射效應和對FPGA的影響,比較不同的FPGA的耐輻射性。
本文引用地址:http://dyxdggzs.com/article/190904.htm輻射的影響
按照是否能造成原子或者分子的電子脫離,輻射主要分為電離性和非電離性?xún)纱箢?lèi),如圖1所示。高能粒子或者電磁波包括X射線(xiàn)和γ射線(xiàn)都能夠產(chǎn)生電離的作用。半導體器件受電離性的輻射影響較大,日常應用中以粒子引起的電離性輻射最常見(jiàn),而其中,以α粒子和中子的影響力較大。
圖1 輻射分類(lèi)
對于太空和地面的應用而言,輻射效應可以分為兩大類(lèi),單事件效應(SEE)和總離子劑量/總劑量(TID)。在對地面的應用中,單事件效應比較普遍,SEE是高能帶電粒子在器件的靈敏區內產(chǎn)生大量帶電粒子的現象,SEE的種類(lèi)很多,尤其以單事件閉鎖(SEL)和單事件/粒子翻轉(SEU)最難處理。當輻射在器件內造成一定程度的離子化的時(shí)候,導通大電流,發(fā)生單事件閉鎖現象,即使在最輕微的情況下,這種閉鎖現象仍會(huì )引起芯片循環(huán)上電,嚴重情況下芯片會(huì )永久損壞。但是,值得高興的是,已經(jīng)可以使用芯片設計和工藝技術(shù)來(lái)減少單事件閉鎖發(fā)生的幾率。
一般電子應用中遇到的輻射問(wèn)題來(lái)自于天然輻射,包括由太陽(yáng)和宇宙的影響造成的因素造成。星系宇宙射線(xiàn)(GCR)是指來(lái)自于太空的α粒子、重離子和質(zhì)子,而太陽(yáng)主要發(fā)射電子、質(zhì)子和重離子。中子的體積非常小,能夠輕易穿過(guò)大氣層,甚至能穿透整個(gè)地球,而且由于其不帶電荷,能逃過(guò)地球的輻射帶陷阱,因此到達地面和半導體產(chǎn)生作用的高能粒子以中子為主。
不同的環(huán)境對產(chǎn)生輻射的影響是不同得,輻射通量隨著(zhù)高度的上升成指數增加,在海拔330km時(shí),是太空電子應用的所在地,海拔50km是軍用飛機所能達到的高度,這里中子和其他粒子的強度都比較高,隨著(zhù)高度繼續降低,輻射的通量隨著(zhù)降低,是商業(yè)飛機的應用高度。
地球上的中子來(lái)源分為天然來(lái)源和人造來(lái)源。天然來(lái)源是來(lái)自宇宙射線(xiàn)與大氣中的氧和氮的相互作用,中子是太陽(yáng)耀斑的副產(chǎn)品。人造來(lái)源包括核武器、核反應堆、醫療設備等。
輻射對FPGA器件影響
單粒子翻轉 (SEU),是指當一個(gè)重離子撞擊一個(gè)電路節點(diǎn),沉積足夠的電荷使該節點(diǎn)的狀態(tài)改變。SEU 不僅限于太空應用,也會(huì )發(fā)生在地面的應用,如醫療、航空電子、汽車(chē)、網(wǎng)絡(luò )和基礎設施。
軟錯誤 (soft error)指存儲器單元或寄存器中可以校正的翻轉,數據被改變,但存儲器單元沒(méi)有損壞,一般影響單一比特位,偶爾影響超過(guò)一個(gè)比特位。
固件錯誤 (firm error)指SRAM FPGA 中配置存儲器的翻轉,它被稱(chēng)為“固件”,是因為錯誤會(huì )一直存在,直到SRAM FPGA重新上電或啟動(dòng)才能清除。固件錯誤多數導致功能故障,后果比軟錯誤嚴重得多,它能夠引起FPGA失效以及整個(gè)系統的故障。
FPGA 器件中的輻射影響分為兩大類(lèi):數據影響(軟錯誤)和配置影響(固件錯誤)。醫療等地面應用中的兩個(gè)重要輻射源則包括中子和α粒子。
數據影響(軟錯誤)數據影響(軟錯誤)包括觸發(fā)器、存儲器單元、組合邏輯單元中的單比特位翻轉。如果能夠校正錯誤,則問(wèn)題不嚴重,非關(guān)鍵性數據可請求重新發(fā)送,對于關(guān)鍵性數據可使用 EDAC/FEC、奇偶校驗冗余手段來(lái)達到保護的目的。
配置影響(固件錯誤)是指FPGA 配置元件的單比特位翻轉,它可以引起 FPGA 故障,也可以影響數百萬(wàn)比特位的數據,甚至可以引發(fā)整個(gè)系統的故障。
圖2 中子對集成電路的影響
中子對集成電路的影響如圖2所示,包括:
•中子可能撞擊硅原子,放出重離子
•重離子在 CMOS IC 中引起瞬時(shí)電流脈沖
•會(huì )改變存儲器單元和觸發(fā)器中的數據
輻射如何引發(fā) SRAM FPGA 失效,引起SRAM FPGA 中的配置翻轉呢?如圖3所示。
圖3 輻射引發(fā)SRAM FPGA失效
非易失性FPGA
Microsemi非易失性 FPGA 具有配置翻轉免疫能力。分為Flash FPGA和反熔絲FPGA,如圖4所示。
圖4 Flash FPGA和反熔絲FPGA
Flash FPGA,高能粒子(大氣中子、太空中的重離子 )不能產(chǎn)生足夠的電荷來(lái)讓浮柵錯誤地改變狀態(tài)。
反熔絲FPGA,反熔絲 FPGA 具有一個(gè)永久編程的金屬鏈接,不會(huì )因高能粒子和其他輻射而發(fā)生改變。
中子導致的數據故障(軟錯誤),Flash FPGA 和 SRAM FPGA 的數據翻轉率相似,這是基于第三方機構 iROC Technologies 所做的分析。
翻轉率是以每一億小時(shí),每百萬(wàn)個(gè)觸發(fā)器計算,每個(gè)故障等于一個(gè)D型觸發(fā)器數據的翻轉,可以用EDAC/FEC、奇偶校驗、CRC等方法輕易校正。
中子導致的配置故障(固件錯誤),每個(gè)故障等于FPGA器件的失效,而越先進(jìn)的工藝通常故障率越高。
深亞微米技術(shù)增加了固件錯誤發(fā)生的概率,半導體的工藝越現金使得由輻射引起的故障率越高,隨著(zhù)CMOS技術(shù)工藝尺寸繼續縮小,這對固件錯誤帶來(lái)實(shí)質(zhì)性影響。如果器件發(fā)生翻轉所需的臨界電荷為QCRIT,QCRIT~VCC×CNODE。更低的電源電壓(VCC)增加了固件錯誤的易感性,使得單粒子翻轉更為普遍;更小的柵極面積 (CNODE)使得電容更小,相關(guān)的臨界電荷也會(huì )減少,因此也增加了固件錯誤的易感性。在CMOS技術(shù)中,工藝尺寸的縮小,使得柵極面積減小,并使電源電壓降低,這兩個(gè)因素都會(huì )讓單粒子翻轉變得更容易。
Microsemi下一代的Flash FPGA仍將具有固件錯誤免疫能力,由于Flash工藝的特點(diǎn),下一代的Flash FPGA能保持足夠大的浮柵電荷QCRIT可以免受大氣中子的影響。QCRIT與工藝節點(diǎn)的影響如圖5所示。
高能中子在SRAM FPGA中會(huì )產(chǎn)生配置翻轉和數據翻轉兩種效應。
配置翻轉導致 FPGA 喪失功能,后果十分嚴重,緩減方式1:三芯片( Triple-Chip )冗余,是把同樣的電路復制到三個(gè)一樣的芯片中,通過(guò)表決的方式,當其中一個(gè)芯片輻射失效,其余的兩個(gè)芯片加起來(lái)可以仍然可以把正確的結果算出來(lái)。但是這種方式消耗過(guò)多的電路板空間及功率,而且需要外部元件進(jìn)行控制和表決。緩減方式2:配置重讀和重載,這種方式不斷重新配置SRAM FPGA把已有的錯誤糾正,但是FPGA有機會(huì )在重載時(shí)再次被中子擊中,在高可用系統中是不可接受的。
數據翻轉導致單一比特位數據錯誤,后果取決于數據特性。緩減方式簡(jiǎn)單,通過(guò)FEC、EDAC、數據清除,使用容錯性設計技術(shù)。
整體而言,緩減方式對SRAM FPGA沒(méi)有太多作用,因為配置翻轉占主導地位,而配置元件占SRAM FPGA的大部分面積。
反熔絲和Flash FPGA不存在配置翻轉, Micorsemi FPGA 器件的配置經(jīng)第三方獨立實(shí)驗室的驗證能夠耐受中子、質(zhì)子、γ射線(xiàn)、X 射線(xiàn)以及重離子的影響。反熔絲、Flash 及 SRAM FPGA 出現數據翻轉的比率相似,導致單一比特位數據錯誤,后果取決于數據特性。緩減方式簡(jiǎn)單,FEC、EDAC、數據清除,使用容錯性設計技術(shù),Micorsemi則已經(jīng)驗證了消除數據錯誤的緩減技術(shù)。
隨著(zhù)醫療設備變得越來(lái)越現金,在醫療設備中的電子元件含量不斷增加,使得SEU變得越來(lái)越重要,使用輻射源的應用很重視SEU免疫力。其中包括
•腫瘤科(使用 X 射線(xiàn)/質(zhì)子源)
•牙科設備,整形設備
• CT掃描,透視,乳房X射線(xiàn)攝影設備
以上這些應用的需求需要可靠的劑量、快速和精確的治療、III類(lèi)/ IV型設備需要有最小的停機時(shí)間,關(guān)鍵部分的功能不能中斷,不能承受功能性錯誤等。
在網(wǎng)絡(luò )和基礎設施中的 SEU,在大型的網(wǎng)絡(luò )中往往用到大量的FPGA,特別是一些跨地域的網(wǎng)絡(luò ),通常會(huì )用到成千上萬(wàn)的FPGA,其中一個(gè)FPGA若發(fā)生問(wèn)題,也可能會(huì )造成整個(gè)網(wǎng)絡(luò )的通信影響,特別是一些高海拔的地區,SEU的效應更為明顯。根據統計,在一些大型跨地域的網(wǎng)絡(luò )中,因為SEU的引起的通信中斷每幾個(gè)小時(shí)可能發(fā)生一次,思科公司內部也針對SEU提出專(zhuān)門(mén)的調試方案和工作條款。
SEU 的免疫力在航空電子中是非常重要的,例如:飛行計算機,駕駛艙顯示器;引擎控制和監控,制動(dòng);座艙增壓和空調;電源控制和分配,飛行表面驅動(dòng)等。而這些功能如果因為SEU而喪失則是不能接受的。
在在汽車(chē)電子中的SEU方面,和醫療應用中非常類(lèi)似,在汽車(chē)設計中,半導體器件的使用越來(lái)越普遍,甚至在關(guān)鍵器件中也能看到FPGA的蹤影,在汽車(chē)行業(yè)中,新版本的 AEC-Q100 規范提出 SER(軟錯誤率)的測試需求,使得它成為基于 SRAM 技術(shù)的強制性規定。
圖5 QCRIT與工藝節點(diǎn)的影響問(wèn)答選編
總結
輻射對于 FPGA 的影響不局限于太空應用,SRAM FPGA 器件易于發(fā)生中子引發(fā)的配置錯誤 (固件錯誤),即便在海平面上亦然。
反熔絲和 Flash FPGA 在所有高度上都具有配置故障的免疫能力(獲第三方獨立研究機構確認的數據證明)。對于高可用性/高可靠系統的關(guān)鍵任務(wù),應該考慮使用反熔絲或Flash FPGA。
問(wèn):X射線(xiàn)對FBGA有沒(méi)有干擾影響?
答:有的,它可以產(chǎn)生電離性中子而導致SEU。
問(wèn):請問(wèn)FPGA產(chǎn)品出廠(chǎng)之前,通常進(jìn)行輻照效應試驗嗎?
答:抗輻射系列的是會(huì )的。
問(wèn):FPGA的抗輻射能力和那些因素?
答:與基本架構及工藝有關(guān)。
問(wèn):磁環(huán)、磁珠對于輻射的濾波到底有多大幫助呢?如果是3MHz~10MHz的輻射干擾,應該怎樣選型磁環(huán)磁珠來(lái)對輸入的信號進(jìn)行濾波?
答:這種方法只能對電磁波干擾有作用,對高能粒子無(wú)能為力。
問(wèn):請問(wèn)是不是其他的通用MCU容易受到強輻射的影響?Flash的工藝和OTP的工藝受到強輻射的影響會(huì )一樣嗎?
答:OTP、Flash都具有抗輻射能力。
問(wèn):非易失性FPGA和反熔絲FPGA器件哪種器件更具有抗輻射能力?
答:反熔絲從原理上更好,但是在測試中兩個(gè)都未發(fā)現抗輻射失敗現象。
問(wèn):如何測試FPGA器件的抗輻射能力?
答:方法有很多,簡(jiǎn)單的方法可用FPGA上的存儲器組成一個(gè)長(cháng)列的移位寄存器來(lái)比較預期結果。
問(wèn):在輻射影響方面是配置翻轉占主導還是數據翻轉占主 導?
答:配置翻轉主導,因為配置單元占晶片面積較大,受影響的機率也較高。
問(wèn):高溫或者低溫對FPGA的容錯能力有影響嗎?
答:在測試中,高溫低溫未發(fā)現異常。但注意器件的工作環(huán)境要求。
問(wèn):對于已經(jīng)在使用中的非耐輻射型的FPGA,如何減少輻射的影響?有何建議?
答:使用電路冗余,相當于多備份,靈活切換。但這很復雜,因為關(guān)系到檢測、判決、切換等。功能受到影響是不可避免的,而且就實(shí)際來(lái)說(shuō),能否實(shí)施還很難說(shuō)。
問(wèn):FPGA的可編程I/O受到輻射粒子的影響會(huì )產(chǎn)生什么問(wèn)題?
答:后果可能非常嚴重,可能造成IO沖突而導致物理?yè)p壞。
問(wèn):一般情況下,大功率電機運行中產(chǎn)生的電源干擾,數據采集卡或者示波器采集的信號往往發(fā)生很大的失真和高頻諧波干擾,這種干擾對FPGA的影響如何?
答:這種情況屬于EMI/EMC的干擾,與輻射的情況不一樣,但有時(shí)候會(huì )產(chǎn)生有相同的影響。
問(wèn):航空FPGA的設計,除了反熔絲技術(shù)、三模冗余技術(shù),還有更好的辦法嗎?Microsemi在工藝上又有什么先進(jìn)之處?
答: Flash FPGA也可以使用,大部分Microsemi的抗輻射FPGA除工藝本身以外在片上已包含三模冗余。
評論