FPGA技術(shù)協(xié)助嵌入式系統競逐于機器學(xué)習之路
機器學(xué)習技術(shù)是人工智能的一個(gè)重要科學(xué)發(fā)展,透過(guò)在經(jīng)驗學(xué)習中改善具體算法的效能,而且用來(lái)訓練的數據越多,所學(xué)習出來(lái)的結果越好,為了處理分析大量圖像或是語(yǔ)音等辨識的機器學(xué)習算法數據,需要采用GPU芯片所打造的高速平行運算處理的類(lèi)神經(jīng)網(wǎng)絡(luò )超級計算機,利用諸如Tensorflow、Caffe等深度學(xué)習框架(Framework)等工具,來(lái)發(fā)展有效的算法。
本文引用地址:http://dyxdggzs.com/article/201710/365483.htm一旦得到算法之后,對嵌入式系統的設計而言,迅速將算法應用到云端數據中心,或是直接到終端的邊緣運算(Edge CompuTIng)裝置上,就是目前人工智能應用成果發(fā)揮的展示場(chǎng)。由于嵌入式系統本身的運算效能與低功率消耗的功能不斷提升,所構建的智能功能、軟硬件解決方案,非常有助于開(kāi)創(chuàng )前所未有的人工智能的應用。
機器學(xué)習的技術(shù)已廣泛應用于數據探勘、計算機視覺(jué)、自然語(yǔ)言處理、生物特征識別、搜索引擎、醫學(xué)診斷、檢測信用卡欺詐、證券市場(chǎng)分析、語(yǔ)音和手寫(xiě)識別、戰略游戲與機器人等應用領(lǐng)域。
可程序設計門(mén)陣列(FPGA)的解決方案,利用其可程序設計性的優(yōu)勢,已經(jīng)廣為業(yè)界所認知,賽靈思(Xilinx)做為FPGA解決方案的主要供貨商而言,密切關(guān)注機器學(xué)習所帶領(lǐng)的產(chǎn)業(yè)趨勢,以及重要的應用范例。賽靈思亞太區工業(yè)及醫療市場(chǎng)的高級經(jīng)理羅霖(Andy Luo)先生接受專(zhuān)訪(fǎng)時(shí),針對Xilinx產(chǎn)品進(jìn)入機器學(xué)習的領(lǐng)域,提綱契領(lǐng)直指兩個(gè)主要的應用領(lǐng)域。
賽靈思亞太區工業(yè)及醫療市場(chǎng)的高級經(jīng)理羅霖(Andy Luo)
首先,在云端機房與數據中心的應用領(lǐng)域,透過(guò)跨國性大型搜索引擎與社群媒體巨擘的緊密合作,以大陸市場(chǎng)為例,Xilinx與百度(Baidu)的搜索引擎加速器合作,具有重要的指標性,由于機器學(xué)習在高效能運算(HPC)平臺上,使用的類(lèi)神經(jīng)網(wǎng)絡(luò )模型與多層次架構(Training Framework)來(lái)訓練算法,一旦將結果應用于數據中心的加速卡設計時(shí),往往需要進(jìn)行細部的調整與開(kāi)發(fā),所以彈性變更邏輯線(xiàn)路的設計要求下,FPGA的可程序化(Programmable)的能力就益行重要。
Xilinx的解決方案之所以迅速攫取多數大廠(chǎng)用戶(hù)的目光,端賴(lài)兩項重要的誘因,也就是低功率消耗與高度靈活的硬件平臺,提供數據中心專(zhuān)用加速器性能上的優(yōu)勢,并支持數據中心業(yè)者,打造更快速的創(chuàng )新應用與技術(shù)。
Xilinx推出可重組加速堆棧(Reconfigurable AcceleraTIon Stack)技術(shù),針對機器學(xué)習、大數據分析和視頻串流直播(Video Streaming)等三大新興計算密集型應用,借助所提供各種應用鏈接庫、開(kāi)發(fā)工具和參考設計,有效的降低設計工程師開(kāi)發(fā)FPGA通用的程序設計門(mén)坎,迅速解決數據中心中工作負載快速增長(cháng)的挑戰,并加速云端服務(wù)產(chǎn)品上市進(jìn)程。
第二個(gè)重要的應用領(lǐng)域,就是在邊緣運算裝置的部署,因為大量的視訊鏡頭的使用,使得嵌入式視覺(jué)(Embedded Vision)技術(shù)可以因為采用機器學(xué)習的算法,而帶來(lái)更多智能型的應用。
但是嵌入式系統考慮功率消耗需求,無(wú)法企求使用32或64位的高效能處理器,因此開(kāi)發(fā)出一種技術(shù),讓多半使用32-bit或16-bit的浮點(diǎn)運算(FloaTIng Point)所設計的算法,可以放在8位整數運算處理器的智能終端裝置上,Xilinx的解決方案在這類(lèi)的應用上,保持算法在嵌入式系統上有效的準確度,所以使用機器學(xué)習所訓練而獲得的算法,當部署到低耗電與低運算密度的系統時(shí),仍能完成人工智能的應用。
智能終端運算應用隨著(zhù)空拍機與自動(dòng)駕駛汽車(chē)的發(fā)展,尤其是先進(jìn)駕駛輔助系統(ADAS)中的自動(dòng)識別、路線(xiàn)規劃,以及無(wú)人機上自動(dòng)避開(kāi)空中障礙,或是視訊監控與辨識分析等新興功能,帶領(lǐng)令人高度期待的應用,也推增FPGA的市場(chǎng)占有率。
另一個(gè)重點(diǎn)就是工業(yè)4.0的應用,這利用傳感器融合(Sensor Fusion)的裝置,將工業(yè)場(chǎng)域所收集的控制數據,做線(xiàn)性規劃與數據分類(lèi),以掌握工業(yè)設備目前的狀態(tài)。選擇Xilinx的FPGA組件能在單一芯片上提供廣泛的高速界面,能以低成本獲得更高效能,并因為各種開(kāi)發(fā)環(huán)境整合到同一平臺上而節省開(kāi)發(fā)資源,讓客戶(hù)得以專(zhuān)注于開(kāi)發(fā)差異化功能的產(chǎn)品,取得市場(chǎng)先機。
低功率消耗與快速反應速度 FPGA獨擅勝場(chǎng)
和GPU為主的解決方案相比,羅霖分析FPGA的主要優(yōu)勢,首推低功耗的設計,通常3瓦的功耗的設計足以支撐整個(gè)加速卡的效能,第二個(gè)重要的優(yōu)勢,是反應速度快速,以微秒等級的反應速度,特別適合在空拍機或是自駕車(chē)應用的領(lǐng)域,因為反應速度決定人身安全的重要訴求。
但是FPGA也有弱點(diǎn),羅霖持平而論,也就是工程師的開(kāi)發(fā)FPGA的時(shí)間較長(cháng),因為需要熟悉使用邏輯線(xiàn)路分析、布局布線(xiàn)等EDA工具才能設計FPGA線(xiàn)路,雖然FPGA現在也可以利用OpenCL和C 語(yǔ)言以類(lèi)似軟件的流程來(lái)程序設計,但是不可諱言的,其工程設計門(mén)坎還是比GPU的使用設計要高,羅霖強調Xilinx對于FPGA在機器學(xué)習方面組成開(kāi)發(fā)者社群,并開(kāi)發(fā)豐富的工具和鏈接庫的,已經(jīng)可以大大提升設計效率。
羅霖指出Xilinx的FPGA解決方案,在全球主要通信系統機房中,一直是用來(lái)做為主要通訊系統的設計,利用密集型計算應用,做為處理通信標準中信號處理與應用,幾乎占了Xilinx的50%的主要收入來(lái)源,但是配合機器學(xué)習所帶領(lǐng)的數據中心加速卡與邊緣運算終端的應用,涵蓋更多的無(wú)人空拍機、智能型視訊影像監控系統、自駕車(chē)的應用,目前已經(jīng)貢獻Xilinx另外的40%的營(yíng)業(yè)收入來(lái)源,前景非常具有爆發(fā)式成長(cháng)動(dòng)能。
展望2017的目標,第一,Xilinx設定工業(yè)物聯(lián)網(wǎng)(IIoT)的應用,從工業(yè)設備常用的PLC應用,以及透過(guò)IEEE TSN、OPC-UA的工業(yè)通訊協(xié)議的整合,以掌握實(shí)時(shí)性的信息,開(kāi)發(fā)工業(yè)應用,第二,面對機器學(xué)習的算法與相關(guān)的FPGA設計工具的加強,加快協(xié)助客戶(hù)做到人工智能功能的快速部署,以達到更卓越的效能需求,并能同時(shí)降低開(kāi)發(fā)成本。
評論