AI 幫忙找 Bug ,英特爾開(kāi)源代碼編程工具 ControlFlag
整理 | 孫勝
出品 | CSDN
近日,英特爾開(kāi)源了自動(dòng)代碼調試工具 ControlFlag 源代碼,ControlFlag 源碼現在可通過(guò) GitHub 獲得。
據了解,ControlFlag 可用來(lái)幫助更多開(kāi)發(fā)者自主檢測代碼錯誤,主要利用 AI 自動(dòng)識別軟件和固件代碼中的錯誤,為開(kāi)發(fā)人員節省手動(dòng)調試時(shí)間。
據悉,英特爾于去年年底首次宣布 ControlFlag,目前該系統只有英特爾內部人員使用,用來(lái)自動(dòng)檢測軟件開(kāi)發(fā)過(guò)程中的異常情況。
來(lái)源于網(wǎng)絡(luò )
減少代碼調試時(shí)間與成本支出
由于代碼調試對于程序開(kāi)發(fā)至關(guān)重要,幾乎所有的大型軟件都需要調試,才能最大程度上避免軟件出錯。
但是對于絕大多數開(kāi)發(fā)人員來(lái)說(shuō),這個(gè)過(guò)程不僅非常耗時(shí),而且大部分調試只能手工作業(yè)。因為修復一個(gè)軟件缺陷可能需要幾天、幾周甚至幾個(gè)月的時(shí)間,據估計,多達 50% 的軟件開(kāi)發(fā)時(shí)間浪費在調試程序上。這是因為大多數錯誤都需要語(yǔ)義分析來(lái)識別、評估根本原因,即使是最先進(jìn)的調試系統也無(wú)法有效地執行這種分析。
英特爾實(shí)驗室首席人工智能科學(xué)家 Justin Gottschlich 也表示:“盡管在過(guò)去的幾十年里,研究自動(dòng)化調試方面取得了部分進(jìn)展,但現有工具仍無(wú)法完美發(fā)現日益復雜的軟件錯誤。這也是調試仍然主要由人為驅動(dòng)的過(guò)程的一個(gè)關(guān)鍵原因?!?/p>
除此之外,調試代碼的預算支出也很高。據英特爾官方介紹,2020 年 IT 行業(yè)在與調試代碼相關(guān)的環(huán)節上大約花費了 2 萬(wàn)億美元,約占 IT 平均預算的一半。
“超能的” ControlFlag
據悉,該系統是英特爾機器編程研究 (MPR) 項目的一部分,該項目的總體目標是通過(guò)自動(dòng)化有望將開(kāi)發(fā)軟件所需的時(shí)間減少 1,000 倍。例如,Gottschlich 的團隊正在研究的領(lǐng)域之一是最終擴展 ControlFlag 的能力,以自動(dòng)修復它檢測到的錯誤。
自去年推出以來(lái),英特爾已在各種軟件系統上測試了該機器學(xué)習工具,并取得了可喜的成果?!爱斘覀冏畛踉O計系統時(shí),我們沒(méi)有預料到它能夠發(fā)現高度復雜的缺陷,”英特爾實(shí)驗室首席人工智能科學(xué)家 Justin Gottschlich 表示?!叭欢?,鑒于其自我監督的設計,ControlFlag 能夠發(fā)現高度復雜、細微的軟件缺陷,甚至連我們這些構建它的人都感到震驚?!?/p>
英特爾的團隊通過(guò)使用一種“無(wú)監督”的學(xué)習方法,以允許 ControlFlag 檢測更廣泛的存儲庫中的錯誤。該系統從超過(guò) 10 億行未標記的源代碼中學(xué)習編碼模式,使其能夠達到很高的準確性,甚至可以適應開(kāi)發(fā)人員的風(fēng)格,以區分軟件異常和編程語(yǔ)言的風(fēng)格變化。
ControlFlag 適用于任何包含控制結構的編程語(yǔ)言(如 C/C++),而且ControlFlag 能夠不斷地從未標記的源代碼中學(xué)習,隨著(zhù)新數據的引入而 “進(jìn)化”,使自己變得更好。雖然它還不能自動(dòng)解決它所發(fā)現的代碼錯誤,但該工具可以為開(kāi)發(fā)人員提供了潛在的修改建議。
Justin Gottschlich 還表示,目前為止僅在兩個(gè)專(zhuān)有軟件存儲庫上使用 ControlFlag,就發(fā)現了生產(chǎn)質(zhì)量、已部署程序中的 300 多個(gè)缺陷。例如,去年 ControlFlag 在名為 Client URL (cURL) 的計算機軟件項目中檢測到代碼異常,該項目每天使用各種網(wǎng)絡(luò )協(xié)議傳輸數據超過(guò) 10 億次。在向 cURL 團隊報告異常后,他們同意 ControlFlag 的發(fā)現并重新設計代碼以修補問(wèn)題。
不斷進(jìn)步的 ControlFlag
隨著(zhù)英特爾團隊致力于開(kāi)發(fā) ControlFlag,過(guò)去的一年也帶來(lái)了相當多的學(xué)習點(diǎn)。Gottschlich 認為,需要改進(jìn)的兩個(gè)關(guān)鍵領(lǐng)域是減少該工具報告的誤報數量,以及將更先進(jìn)的語(yǔ)義分析器集成到 ControlFlag 的推理中。
然而,作為一個(gè)將成為英特爾機器編程工具套件之一的系統,ControlFlag 將繼續發(fā)展?!癈ontrolFlag 的進(jìn)步不太可能停止,”Gottschlich 強調?!斑@主要是因為隨著(zhù)軟件編程語(yǔ)言、硬件描述語(yǔ)言和計算設備的發(fā)展,ControlFlag 也需要發(fā)展以跟上它們的步伐?!?/p>
與此同時(shí),英特爾的 MPR 團隊正在開(kāi)展一些專(zhuān)注于簡(jiǎn)化軟件開(kāi)發(fā)的項目。例如,去年該公司還發(fā)布了一款與麻省理工學(xué)院實(shí)驗室共同開(kāi)發(fā)的工具,該工具可以研究代碼片段以了解軟件打算做什么。該系統稱(chēng)為 MISIM(機器推斷代碼相似性),它使用預先存在的代碼目錄來(lái)理解新算法背后的意圖,并通過(guò)建議其他編程方法或提供使代碼更高效的選項來(lái)幫助工程師開(kāi)發(fā)軟件。
Gottschlich 預計 MISIM 有一天會(huì )與 ControlFlag 一起工作?!爱斦_想法融合在一起時(shí),我們設想了一個(gè)更強大的新系統,該系統將能夠檢測 ControlFlag 目前可以檢測到的所有缺陷,以及由于潛在的復雜性而目前無(wú)法檢測到的數百種缺陷?!盙ottschlich表示。
對此,你怎么看,歡迎留言評論。
參考鏈接:
https://www.zdnet.com/article/developers-intels-automated-debugging-tool-controlflag-is-now-open-source/
GitHub地址:
https://github.com/IntelLabs/control-flag
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。