在高精度時(shí)間間隔測量中隔離位誤碼率突發(fā)事件
發(fā)現、識別和隔離罕見(jiàn)定時(shí)事件(rare timing event)、競爭狀態(tài)和非確定性抖動(dòng)效應通常十分困難。隨著(zhù)業(yè)界采用各種經(jīng)驗規則和近似方法來(lái)判斷設計方案的統計特性何時(shí)達到“足夠好”的水平,這一點(diǎn)在今天變得尤為突出。更重要的是,這個(gè)問(wèn)題還很容易掩蓋潛在的重大設計缺陷。本文介紹一個(gè)簡(jiǎn)單的案例研究,它不注重理論分析,而是嘗試展示如何通過(guò)逐周期的波形分析來(lái)大幅提高工程人員的能力,使他們對罕見(jiàn)事件更加了解,進(jìn)而捕捉這些罕見(jiàn)事件并分析其實(shí)質(zhì),隔離其來(lái)源。
我們需要測試串行數據流的組成,它們與高性能數字視頻應用中的信號有些類(lèi)似。我們采用HP 8133A精密數字信號發(fā)生器和取樣速率達20GSa/sec的安捷倫54855A實(shí)時(shí)示波器來(lái)激勵和捕捉一系列單次數字波形。8133A發(fā)生器廣泛用來(lái)產(chǎn)生數字信號流和時(shí)鐘。這種脈沖發(fā)生器的一些新款型功能更強,為用戶(hù)對已知數字信號進(jìn)行精密抖動(dòng)測量提供了最大的裕度。圖1顯示了8133A的抖動(dòng)測試性能,在A(yíng)SA公司的M1上測量時(shí),小于800fs RMS。
可以想象,當某天發(fā)現8133A產(chǎn)生類(lèi)型稍有不同的測量結果時(shí),我們會(huì )有多么驚訝。圖2中左側圖形是一個(gè)很不尋常的結果,數據信號中的規則抖動(dòng)應當與右側圖形相似才對。
實(shí)際上,我們在最初以及進(jìn)行的所有研究取樣中從未見(jiàn)過(guò)這種“四模式”柱狀圖。這個(gè)柱狀圖是如此罕見(jiàn),以至于在使用眼圖和柱狀圖進(jìn)行數百次取樣(經(jīng)歷好幾天時(shí)間)和查找之后,我們再也沒(méi)有見(jiàn)到過(guò)與之相似的柱狀圖。當我們決心要找到和顯示同樣的柱狀圖,并為此做出了一番精心策劃的努力之后,對它的看法也相應發(fā)生了改變。
不過(guò),假設在研究試驗中偶然捕捉到了類(lèi)似“四模式”柱狀圖的一個(gè)瞬時(shí)、單次出現的波形取樣。果真如此,可能會(huì )想:“嗯,這可真是怪事,一定是哪兒出錯了,才會(huì )出現這種情況!”之后,我們很可能按下“運行/停止”按鈕再次取樣,特別是當覺(jué)得自己的設備吞吐率高、更新快速、非常令人滿(mǎn)意時(shí)。由于上面的“四模式”柱狀圖實(shí)際上是一個(gè)罕見(jiàn)事件時(shí),因此下一個(gè)以及下幾百個(gè)取樣幾乎肯定不會(huì )再出現類(lèi)似的結果。
事實(shí)上,在查找過(guò)程中我們一直沒(méi)有發(fā)現這種“四模式”柱狀圖。當我們認識到自己遇到的問(wèn)題時(shí),我們就必搜索這個(gè)圖形。但是,在搜索之前,我們必須知道它確實(shí)存在。而且,由于罕見(jiàn)事件如此稀少,捕捉它們的最佳途徑就是一開(kāi)始就秉持正確的態(tài)度。
了解罕見(jiàn)事件
在A(yíng)SA公司,我們很少認為統計方法能夠幫助找到罕見(jiàn)定時(shí)或抖動(dòng)事件。我們相信罕見(jiàn)事件要比人們想象的普通得多。罕見(jiàn)事件有多種不同的形式,有些真正是非常難得發(fā)生一次的差錯,其他的是一些長(cháng)周期事件,有些是以短時(shí)突發(fā)形式發(fā)生的。我們也了解所有測試設備的一些基本局限,人們應該具備相應的洞察力,可以理解測試設備表明的有關(guān)罕見(jiàn)事件的意義。本文后面將簡(jiǎn)要概述一下測試設備的部分局限性。實(shí)時(shí)、逐周期的波形捕捉要遠比欠采樣方法好得多,我們傾向于取樣一次隨即就對它進(jìn)行分析;而不是大量取樣,再通過(guò)運用測量算法對波形數據進(jìn)行處理來(lái)得出結果。我們相信,查找罕見(jiàn)定時(shí)事件成功的一半在于如何設計查找方法。
發(fā)現罕見(jiàn)事件
不過(guò),如何才能發(fā)現這種稍縱即逝的“四模式”柱狀圖呢?我們在串行數據流上測量RjDj。無(wú)論是RjDj數值本身,還是眼圖或波形都無(wú)法識別出這個(gè)罕見(jiàn)錯誤。在一次連續取樣過(guò)程中觀(guān)察M1時(shí),注意到有時(shí)單次采樣的Rj/Dj/Tj數值突然“跳動(dòng)”一個(gè)相當大的幅度,即使累加了 100次采樣之后仍然如此。這種現象非常特別,因為被測系統據信是非常穩定的。這個(gè)現象也在收斂指示器上得到了證實(shí),它們一直顯示處于收斂狀態(tài),只在罕見(jiàn)情況下才出現發(fā)散。這種現象令我們感到奇怪,測量?jì)x器告訴我們發(fā)生了問(wèn)題。
起初,我們分析肯定是自己在測量時(shí)出錯了,但在使用新的54850系列示波器時(shí),感覺(jué)和使用8133A一樣。而這種示波器性能非常優(yōu)秀,不可能自己產(chǎn)生這種現象。一定是軟件中有什么錯誤!但是,我們什么也沒(méi)找到,于是開(kāi)始審視自己的測量方法,但是也沒(méi)有找到想象中的錯誤。我們嘗試再次進(jìn)行測量,卻無(wú)法復現先前的結果。
我們利用M1的“記錄到磁盤(pán)”特性,記錄下了20分鐘左右過(guò)程中進(jìn)行的500次連續取樣所獲得的帶時(shí)間標記的數據。同時(shí),利用M1的Rj/Dj ASM(針對特定應用的測量)屏幕上的“保存”功能,將每次取樣的Rj/Dj/Tj值保存到了一個(gè)文本文件。這個(gè)文本文件被加載到Excel,根據取樣序號繪出了Rj/Dj/Tj曲線(xiàn),如圖3所示。Tj圖至少顯示出了三個(gè)明顯的“跳變”,對應的取樣序號約為63、106和280。
這時(shí),我們開(kāi)始意識到出現了一些奇怪的情況。毫無(wú)道理,Tj的值會(huì )在一次取樣中劇烈增加,一定是數據中出現了什么問(wèn)題。
識別罕見(jiàn)事件
利用M1 的“自動(dòng)加載”特性和早前保存的時(shí)間標記數據,我們可以按多種視圖查看數據,以便了解在兩次取樣之間它們是如何改變的,或者有無(wú)改變。查看信號沿抖動(dòng)柱狀圖時(shí),我們發(fā)現某些取樣的柱狀圖分布形狀與其他大部分取樣顯著(zhù)不同,參見(jiàn)本文前面的頭兩幅柱狀圖。找到那些特定的取樣后,發(fā)現它們正是使Tj值發(fā)生跳變的那幾個(gè)取樣。
這時(shí),我們開(kāi)始把這三個(gè)事件看作罕見(jiàn)定時(shí)事件。我們認識到在500個(gè)取樣中只發(fā)現3了個(gè)奇怪的取樣,而且每個(gè)取樣記錄了大約3萬(wàn)個(gè)周期的波形,總共有約1500萬(wàn)個(gè)周期的波形信息。顯然,這是一個(gè)虛假事件,如果不是罕見(jiàn)事件的話(huà)。但它不是那種經(jīng)過(guò)15天數據傳輸之后才出現一個(gè)位誤碼的罕見(jiàn)事件。另外一點(diǎn)需要注意的是,柱狀圖的形狀很不相同,表明不止一位數據出現異常,而是有一系列數據位都發(fā)生了錯位。這次錯誤不是一個(gè)單獨的錯誤,而是偶然出現的一組錯誤。更專(zhuān)業(yè)的表述是,這次錯誤看來(lái)是罕見(jiàn)的、偶然性的和突發(fā)性的。
考察問(wèn)題取樣數據所繪出的信號沿抖動(dòng)圖和脈寬抖動(dòng)圖中的尖峰位置時(shí),可發(fā)現以下二者的位置之間有著(zhù)很強的關(guān)聯(lián)性:1. 已知跳變位置;2. 與問(wèn)題取樣相關(guān)的篩選信號沿抖動(dòng)中的明顯變化。殘差與平均單位間隔時(shí)間的影響并不是根本性的。通過(guò)這個(gè)分析,有關(guān)M1的疑問(wèn)基本上被排除了。因此我們得到的結論是,在發(fā)生跳變的取樣位置上很可能確實(shí)存在BER突發(fā)。
分離罕見(jiàn)事件
為了確定上述特性是確實(shí)存在于信號本身,還是M1或示波器所帶來(lái)的,我們用不同的示波器、不同的脈沖發(fā)生器和不同的抖動(dòng)分析工具進(jìn)行了很多次測試。結果表明,只有這個(gè)特定的信號發(fā)生器表現出了“跳變”的特性。這給了我們很大信心,問(wèn)題應當出在信號源本身,或是某種環(huán)境因素對信號源產(chǎn)生了影響。
由此可見(jiàn),一個(gè)簡(jiǎn)單的方法就是將脈沖發(fā)生器與其所在的環(huán)境隔離開(kāi)來(lái)。事實(shí)上,多年來(lái)ASA公司已經(jīng)發(fā)現有許多環(huán)境不適合進(jìn)行精確的定時(shí)和抖動(dòng)測量。一些日常的辦公環(huán)境會(huì )成為引起位誤碼的來(lái)源。有時(shí),這些環(huán)境問(wèn)題會(huì )影響信號發(fā)送源,就象本例中的情況一樣。大多數時(shí)候,它們影響的是接收器。
我們并不關(guān)心是8133A脈沖發(fā)生器對耦合進(jìn)來(lái)的環(huán)境因素過(guò)于敏感,還是儀器本身產(chǎn)生了錯誤。我們關(guān)心的是,到現在可以推斷,我們多年來(lái)一直信賴(lài)的標準脈沖發(fā)生器看來(lái)至少容易受到一些(內部或外部)激勵所引起的BER突發(fā)的影響。這是一個(gè)首先需要抓住的事實(shí)。
發(fā)現罕見(jiàn)事件的其他方法
發(fā)現罕見(jiàn)事件的方法很多。最常用的方法就是讓示波器以無(wú)限制持續模式整晚運行。這樣有可能在眼圖或柱狀圖中捕獲一些蛛絲馬跡。當然,我們同樣也有可能忽略這些數據。歸根到底,人們不可能真正知道在整個(gè)夜晚期間環(huán)境中到底發(fā)生了什么情況。更重要的是,許多示波器,尤其是那些不執行逐周期波形取樣并在屏幕上顯示取樣存儲器中每一個(gè)周期數據的那些儀器,要以小于100波形/秒的更新速率在寬度為兩個(gè)周期的時(shí)間窗口中發(fā)現一個(gè)罕見(jiàn)事件(如10-12 BER)不是一件容易的事情,即使連續工作10小時(shí)也未必能做到。而且就算捕捉到了罕見(jiàn)事件,“四模式”柱狀圖又表明了誤碼來(lái)源的什么信息呢?回顧一下,現在已經(jīng)得到了“四模式”柱狀圖,但仍然無(wú)法確定僅憑這個(gè)柱狀圖本身能表明問(wèn)題起源的任何信息。不過(guò)它確實(shí)表明出現了問(wèn)題。
如果用PRBS波形通過(guò)硬件或軟件方式來(lái)進(jìn)行同步,有些示波器可以追溯錯誤圖案的位置。這種方法使用方便,但實(shí)際上它只適用于示波器能夠與信號發(fā)生器進(jìn)行同步的激勵/響應應用。這種系統無(wú)法用于實(shí)時(shí)設計中的真實(shí)數據。另外,使用PRBS信號源來(lái)調試設備對于查找由確定性時(shí)不變錯誤(如符號之間的干擾)引起的誤碼可能非常有幫助。但是,重復性的PRBS圖案測試對于實(shí)時(shí)信號并不足夠,除非采用一個(gè)很長(cháng)的PRBS圖案,并且使用一個(gè)既能查看確定性時(shí)不變定時(shí)錯誤又能查看非確定性時(shí)變定時(shí)錯誤的實(shí)時(shí)示波器來(lái)捕捉這個(gè)圖案。一種理想的方法是使用一臺實(shí)時(shí)示波器和一個(gè)長(cháng)PRBS圖案或一個(gè)由實(shí)際設計環(huán)境中部件的實(shí)時(shí)應用所產(chǎn)生的實(shí)時(shí)隨機數據流。
我們本來(lái)可以利用一個(gè)位誤碼率測試器(BERT)來(lái)幫助表征異?,F象,它們對表征設計非常有益,但也非常昂貴(即使租用一個(gè)月也是代價(jià)不菲)。而且,雖然我們知道通過(guò)這種方法可以判定系統是否存在一些問(wèn)題,但位誤碼率數值又表明了什么信息呢?位誤碼率測試器確實(shí)具有許多優(yōu)秀的功能可用來(lái)表征多種不同情形下的位誤碼率,但是在實(shí)踐中,我們很少看見(jiàn)系統設計人員用它來(lái)對設計方案進(jìn)行調試。
本文小結
本文介紹了很多技巧,特別是在罕見(jiàn)事件的捕捉方面。首先,發(fā)現一個(gè)特殊的柱狀圖、一個(gè)無(wú)法解釋的測量結果,或者一個(gè)統計上的罕見(jiàn)曲線(xiàn)之后,你應該立即停止正在進(jìn)行的工作,并相信它是真實(shí)的。不要再次按下示波器的“運行/停止”按鈕,希望消除這個(gè)現象。相反,你應該立即將波形保存到硬盤(pán)。這有可能是一個(gè)罕見(jiàn)事件。其次,在這個(gè)例子中,不考慮抖動(dòng)特征中的非確定性現象可能是不對的。BER突發(fā)不是某種容易通過(guò)一次重復測試來(lái)表征的現象。第三,有些方法會(huì )忽略罕見(jiàn)事件,如欠采樣、等時(shí)波形捕捉、完全只注意RjDj的數值大小而忽視其在時(shí)間上的收斂性等,這些方法都會(huì )掩蓋潛在的罕見(jiàn)事件。
本例中的BER突發(fā)是在比較凈化的環(huán)境中發(fā)現的。在實(shí)時(shí)應用中,很少會(huì )有凈化的環(huán)境。實(shí)際系統的電路板上有許多不確定的抖動(dòng)和虛假電子信號。ASA公司發(fā)現,許多工程人員使用堆疊式裝置而希望產(chǎn)生或測量皮秒級的定時(shí),這是不切實(shí)際的。
某些部件對于虛假外部激勵的影響具有較好的耐受性??上Ш苌儆胁考O計人員(甚或使用這些零部件的系統設計人員)花時(shí)間來(lái)了解外部虛假激勵的敏感性,這可能會(huì )給系統設計人員帶來(lái)后續的問(wèn)題。
回頭再看,幾乎所有工具都可能遇到這些錯誤,任何方法也都可能發(fā)生這些錯誤。重要的是,在本例中,M1的幾項功能幫助我們更加迅速地掌握到了罕見(jiàn)事件的實(shí)質(zhì)。首先,我們采用了一種非統計的方法。M1的RjDj提取法建立在逐周期數據分析的基礎之上,它使非確定性BER的效果得以迅速地呈現出來(lái)。其次,我們使用M1的抖動(dòng)頻域視圖來(lái)將取樣轉化到頻域,以了解問(wèn)題采樣中是否有任何頻率分量導致誤碼發(fā)生。本例中雖然沒(méi)有出現這種情況,但在其他情況下,這是另一項特別有用的調試工具。再次,M1的“記錄到磁盤(pán)”功能以及全新的“自動(dòng)加載”特性也對分析極其有用。新的RjDj文本保存特性也是如此。最后,在本例的調試過(guò)程中,通過(guò)繪出各個(gè)周期的RjDj曲線(xiàn)和觀(guān)察RjDj的收斂/發(fā)散情況來(lái)查看RjDj值的跳變情況也非常重要。相對任何欠取樣方法而言,實(shí)時(shí)、逐周期的取樣并不是一個(gè)微不足道的優(yōu)點(diǎn)?;谶@一分析,我們強烈推薦你采用M1,這不僅是為了表征串行數據設計方案,同時(shí)也是了解和調試它的需要。
作者:Greg Walz
產(chǎn)品市場(chǎng)經(jīng)理
Amherst Systems Associates
Email: greg_walz@amherst-systems.com
評論