ABX盲聽(tīng)測試簡(jiǎn)介
人們平常聽(tīng)音樂(lè ),受到來(lái)自各方面因素影響著(zhù)我們的實(shí)際聽(tīng)感。這些因素包括線(xiàn)纜、揚聲器甚至軟件解碼器本身。那我們如何才能分辨出這些因素帶來(lái)的究竟是正面的還是反面的影響呢?
ABX測試可以帶給我們答案。ABX測試是音頻應用方面常見(jiàn)的用于衡量或比較相同性質(zhì)的對象之間不可量化的特性(比如音質(zhì))的方法。
在這種測試中,測試人會(huì )獲得三個(gè)分別被標記為A、B和X的音源。A和B是用作參考的,它們一個(gè)是被處理過(guò)的,另一個(gè)是未被處理過(guò)的,比如說(shuō),一個(gè)是原 始的WAV文件,另一個(gè)是從WAV文件壓縮得到的mp3文件。X是未知的音源,它可能是A,也可能是B。測試人必須通過(guò)聆聽(tīng)比較它是A還是B。右圖是一個(gè)典型的ABX測試軟件的界面。
由于選擇只有兩個(gè),不是選A就是選B,有50%的機會(huì )選對,因此單純的一次測試并不能說(shuō)明問(wèn)題。需要進(jìn)行統計分析,也就是說(shuō),需要進(jìn)行不止一次的測 試。通 常的做法一般要求測試人對一個(gè)測試重做15遍,每次測試時(shí)都會(huì )從A和B兩者中隨機抽出一個(gè)作為X。根據所有的測試結果進(jìn)行分析,便可大大減少碰巧選對的可 能。從概率上看,一次測試選對的機率是50%,而重復做16次測試都選對的機率則是50%的16次方,即65536分之一。換句話(huà)說(shuō),如果A和B之間的差 異非常的小,測試人根本就聽(tīng)不到區別,則測試人的平均結果應是一個(gè)趨向于50%的值。如果A和B之間存在著(zhù)明顯的差異,則測試人的平均結果應有明顯的傾向 性。
比如,我們需要比較兩對喇叭的音質(zhì)。顯然,他們應該具有不同的表現。我們把測試進(jìn)行7次后,會(huì )有128分之一的機會(huì )獲得一個(gè)虛假的正確答案,即根據測 試結 果進(jìn)行統計后得到的匯總結果與實(shí)際情況相比是錯誤的。在統計學(xué)上,這種情況被稱(chēng)為“第一類(lèi)錯誤”。該類(lèi)錯誤發(fā)生的可能性隨著(zhù)測試次數的增加而減少,測試次 數每增加1次,發(fā)生錯誤的可能性就隨之減少2分之1。。
現在,我們在CD播放機旁邊放上一個(gè)手鐲,然后再進(jìn)行測試??梢哉f(shuō),這應該對音質(zhì)不會(huì )有任何影響。我們把測試重復40次,成功分辨出音質(zhì)不同的可能性 是2 的40次方分 之1??梢哉f(shuō),出錯的幾率是非常小的。但如果測試結果證明放和不放手鐲的確會(huì )產(chǎn)生音質(zhì)上的差別,那必須有一個(gè)解釋?zhuān)嚎赡苁菧y試人聽(tīng)到操作人員在移動(dòng)或放下 手鐲時(shí)發(fā)出了聲音;或者每次手鐲放在播放機旁邊時(shí)操作員的動(dòng)作都會(huì )變慢;又或者 其它各種各樣的非聽(tīng)覺(jué)因素導致出現這樣的結果。
關(guān)于統計方面的事情,估計也沒(méi)有誰(shuí)有興趣深入討論,就此打住。但從以上的簡(jiǎn)單解釋中,我們可以提煉對于A(yíng)BX盲聽(tīng)測試的一些規則:
1、想驗證實(shí)際上不存在的事情是不可能的。如果你對一件事情有疑問(wèn),比如對認為某個(gè)音 頻編解碼器會(huì )影響音質(zhì),你應該通過(guò)測試去證實(shí),而不是基于任何假設去 想當然。
2、測試應該以雙盲條件進(jìn)行。單盲測試意味著(zhù)你除非通過(guò)實(shí)際聆聽(tīng)否則無(wú)法分辨出X究竟是A還是B。雙盲測試則意味著(zhù)測試過(guò)程中操作員和測試人都不知道X是 A還是B,以避免可能出現有意或無(wú)意的操作員暗示。也即需要第三人專(zhuān)門(mén)負責進(jìn)行切換。在計算機上有相當多的軟件可以進(jìn)行ABX測試。
3、確保測試人只有在測試完成后才知道結果,包括正式測試前可能會(huì )進(jìn)行的試驗性測試。否則的話(huà),則應改為在每一次測試之后測試人都能知道結果,并能隨時(shí)決 定中止測試。
4、測試必須是首次進(jìn)行。如果不是的話(huà),之前進(jìn)行的所有測試結果都應一同被匯總考慮。
5、測試人可以保留意見(jiàn),即測試過(guò)程中可以在對自己的判斷不
評論