機器學(xué)習不斷接近人腦水平,AI圖像識別未來(lái)發(fā)展如何?
過(guò)去十幾年,人類(lèi)可以說(shuō)是在機器智能面前節節退敗,屢敗屢戰,而多任務(wù)處理(multi-tasking)幾乎是為數不多可以讓人類(lèi)驕傲的事情了。人們可以同時(shí)打開(kāi)8個(gè)網(wǎng)站、數份文檔和一個(gè)交友軟件,即使正在專(zhuān)心處理其中一件事,只要突然收到一條回復或更新提醒,也能夠快速安排。對機器而言,要在同一時(shí)間完成這樣的任務(wù)顯然有點(diǎn)困難,因此,多任務(wù)處理一直被視為人類(lèi)獨有的技能點(diǎn)。
本文引用地址:http://dyxdggzs.com/article/201812/396039.htm然而,這個(gè)優(yōu)勢也將失去了。
近幾年,Alphago、視頻識別、指紋解鎖、圖片識別、語(yǔ)音轉文字、機器人看病等一系列事件,使我們深刻的感受到人工智能在改變我們的工作方式和認知。國內人工智能產(chǎn)業(yè)中,就算集視覺(jué)與圖像領(lǐng)域公司的數量已達數百家,僅次于自然語(yǔ)言處理類(lèi)公司,位居第二。其中該領(lǐng)域最為出名的創(chuàng )業(yè)公司包括曠世科技Face++、商湯科技、極鏈科技Video++等。
一百多年前,電改變了生產(chǎn)、交通和農業(yè)等產(chǎn)業(yè),而今天,人工智能也像電一樣將改變傳統產(chǎn)業(yè)。人臉識別和圖片識別是人工智能視覺(jué)與圖像領(lǐng)域中的兩大熱門(mén)應用。但將人工智能技術(shù)單純用于圖片識別分析的應用企業(yè)數量并不如預想的多,可能有以下幾個(gè)方面的原因:目前視頻監控方面的盈利空間大,眾多企業(yè)的注意力都放在了視頻監控領(lǐng)域,人臉識別屬于圖片識別的一個(gè)應用場(chǎng)景,做人臉識別的大多數企業(yè)同時(shí)也在提供圖片識別服務(wù),但是銷(xiāo)售效果不佳,主要贏(yíng)利點(diǎn)還在于人臉識別等。

識別物體是圖片分類(lèi)的另一個(gè)比較常見(jiàn)的應用,例如一個(gè)簡(jiǎn)單的手機識別模型,我們首先要給計算機定義模型,然后準備大量手機的照片去訓練這個(gè)模型,讓計算機能識別出來(lái),輸一張圖片的時(shí)候能識別出圖片是不是手機。正常情況下計算機模型能識別得比較準確,但是當我們輸入了一些有遮擋、形態(tài)多變或者角度多變、光照不易的圖片時(shí),之前我們建立的模型就識別不出來(lái)了。這就是計算機視覺(jué)在應用中尋在的難點(diǎn)問(wèn)題。機器學(xué)習的本質(zhì)其實(shí)就是為了找到一個(gè)函數,讓這個(gè)函數在不同領(lǐng)域發(fā)揮不同的作用,像語(yǔ)音識別領(lǐng)域,這個(gè)函數會(huì )把一段語(yǔ)音識別成一段文字。圖像識別的領(lǐng)域,這個(gè)函數會(huì )把一個(gè)圖像映射到一個(gè)分類(lèi)。
進(jìn)入21世紀,計算機視覺(jué)與計算機圖形學(xué)的相互影響日益加深,基于圖像的繪制成為研究熱點(diǎn),高效求解復雜全局優(yōu)化問(wèn)題的算法得到發(fā)展。到現在,通過(guò)技術(shù)迭代更新和機器學(xué)習,物體的識別率也已經(jīng)達到了相當高的水平。像是極鏈科技Video++自主開(kāi)發(fā)的文娛人工智能系統「VideoAI」已實(shí)現場(chǎng)景、物體、人臉、品牌、表情、動(dòng)作、地標、視覺(jué)特征檢索8大維度的數據結構化,同步生成軌跡流數據,通過(guò)復合推薦算法將元素信息升級為情景信息,直接賦能各種商業(yè)化場(chǎng)景。

通過(guò)SAS針對企業(yè)人工智能的調研報告可以看出,大部分企業(yè)認為人工智能還處于初期階段,但我們也可以發(fā)現,正在部署的大量應用場(chǎng)景都包含AI板塊。顯而易見(jiàn)我們必須學(xué)習新的技能來(lái)配合AI的發(fā)展,未來(lái)也是屬于意識到這一點(diǎn)并立即發(fā)展的企業(yè)。機器的每一點(diǎn)進(jìn)步都依賴(lài)于不斷模擬和接近人腦的水平,提升AI在場(chǎng)景應用上的工程能力,會(huì )為生活帶來(lái)更多的便利。
評論