<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 人工智能與計算機視覺(jué)

人工智能與計算機視覺(jué)

作者: 時(shí)間:2018-07-30 來(lái)源:網(wǎng)絡(luò ) 收藏

  前不久,vivo宣布成立AI全球研究院,將會(huì )加大對多個(gè)領(lǐng)域包括知識圖譜、自然語(yǔ)言以及機器視覺(jué)等加大投入,深入研究開(kāi)發(fā)創(chuàng )新性技術(shù)。

本文引用地址:http://dyxdggzs.com/article/201807/389708.htm

  過(guò)去幾年,全球的互聯(lián)網(wǎng)公司包括谷歌、微軟、Facebook以及中國的百度、阿里巴巴都在加強領(lǐng)域的投資,設立自己的研究院。vivo是第一家設立專(zhuān)攻人工智能方向研究院的中國手機公司。此舉是vivo內部已經(jīng)確立的一份3-5年的中長(cháng)期發(fā)展的戰略規劃,未來(lái)對人工智能的發(fā)展研究是必然趨勢,vivo公司創(chuàng )始人兼CEO沈煒曾表示“人工智能和5G的結合將會(huì )是5G時(shí)代手機發(fā)展的趨勢”。

  今年我們看到vivo在產(chǎn)品上不少創(chuàng )新,比如AI拍照、商用屏下指紋技術(shù)等等,這些都是基于生物特征(biometrics)的鑒別技術(shù),除此之外還有對人臉、虹膜、指紋、聲音等特征上的識別,這些大多涉及到視覺(jué)信息,正是體現了的應用性,那什么是呢?


人工智能與計算機視覺(jué)


  技術(shù)的概念

  正像其它學(xué)科一樣,一個(gè)大量人員研究了多年的學(xué)科,卻很難給出一個(gè)嚴格的定義,模式識別如此,目前火熱的人工智能如此,計算機視覺(jué)亦如此。與計算機視覺(jué)密切相關(guān)的概念有視覺(jué)感知(visual perception),視覺(jué)認知(visual cognition),圖像和視頻理解( image and video understanding)。這些概念有一些共性之處,也有本質(zhì)不同。

  從廣義上說(shuō),計算機視覺(jué)就是“賦予機器自然視覺(jué)能力”的學(xué)科。自然視覺(jué)能力,就是指生物視覺(jué)系統體現的視覺(jué)能力。一則生物自然視覺(jué)無(wú)法嚴格定義,在加上這種廣義視覺(jué)定義又“包羅萬(wàn)象”,同時(shí)也不太符合40多年來(lái)計算機視覺(jué)的研究狀況,所以這種“廣義計算機視覺(jué)定義”,雖無(wú)可挑剔,但也缺乏實(shí)質(zhì)性?xún)热?,不過(guò)是一種“循環(huán)式游戲定義”而已。

  實(shí)際上,計算機視覺(jué)本質(zhì)上就是研究視覺(jué)感知問(wèn)題。視覺(jué)感知,根據維科百基(Wikipedia)的定義, 是指對“環(huán)境表達和理解中,對視覺(jué)信息的組織、識別和解釋的過(guò)程”。根據這種定義,計算機視覺(jué)的目標是對環(huán)境的表達和理解,核心問(wèn)題是研究如何對輸入的圖像信息進(jìn)行組織,對物體和場(chǎng)景進(jìn)行識別,進(jìn)而對圖像內容給予解釋。

  計算機視覺(jué)(Computer Vision, CV)是一門(mén)研究如何讓計算機達到人類(lèi)那樣“看”的學(xué)科。更準確點(diǎn)說(shuō),它是利用攝像機和電腦代替人眼使得計算機擁有類(lèi)似于人類(lèi)的那種對目標進(jìn)行分割、分類(lèi)、識別、跟蹤、判別決策的功能。

  計算機視覺(jué)是使用計算機及相關(guān)設備對生物視覺(jué)的一種模擬,是人工智能領(lǐng)域的一個(gè)重要部分,它的研究目標是使計算機具有通過(guò)二維圖像認知三維環(huán)境信息的能力。計算機視覺(jué)是以圖象處理技術(shù)、信號處理技術(shù)、概率統計分析、計算幾何、神經(jīng)網(wǎng)絡(luò )、機器學(xué)習理論和計算機信息處理技術(shù)等為基礎,通過(guò)計算機分析與處理視覺(jué)信息。

  通常來(lái)說(shuō),計算機視覺(jué)定義應當包含以下三個(gè)方面:

  1、對圖像中的客觀(guān)對象構建明確而有意義的描述;

  2、從一個(gè)或多個(gè)數字圖像中計算三維世界的特性;

  3、基于感知圖像做出對客觀(guān)對象和場(chǎng)景有用的決策。

  作為一個(gè)新興學(xué)科,計算機視覺(jué)是通過(guò)對相關(guān)的理論和技術(shù)進(jìn)行研究,從而試圖建立從圖像或多維數據中獲取“信息”的人工智能系統。計算機視覺(jué)是一門(mén)綜合性的學(xué)科,其中包括計算機科學(xué)和工程、信號處理、物理學(xué)、應用數學(xué)和統計學(xué),神經(jīng)生理學(xué)和認知科學(xué)等,同時(shí)與圖像處理,模式識別,投影幾何,統計推斷,統計學(xué)習等學(xué)科密切相關(guān),近年來(lái),與計算機圖形學(xué),三維表現等學(xué)科也發(fā)生了很強的聯(lián)系。

  人工智能與計算機視覺(jué)

  計算機視覺(jué)與人工智能有密切聯(lián)系,但也有本質(zhì)的不同。人工智能的目的是讓計算機去看、去聽(tīng)和去讀。圖像、語(yǔ)音和文字的理解,這三大部分基本構成了我們現在的人工智能。而在人工智能的這些領(lǐng)域中,視覺(jué)又是核心。大家知道,視覺(jué)占人類(lèi)所有感官輸入的80%,也是最困難的一部分感知。如果說(shuō)人工智能是一場(chǎng)革命,那么它將發(fā)軔于計算機視覺(jué),而非別的領(lǐng)域。

  人工智能更強調推理和決策,但至少計算機視覺(jué)目前還主要停留在圖像信息表達和物體識別階段?!拔矬w識別和場(chǎng)景理解”也涉及從圖像特征的推理與決策,但與人工智能的推理和決策有本質(zhì)區別。


人工智能與計算機視覺(jué)


  計算機視覺(jué)和人工智能的關(guān)系:

  第一, 它是一個(gè)人工智能需要解決的很重要的問(wèn)題。

  第二, 它是目前人工智能的很強的驅動(dòng)力。因為它有很多應用,很多技術(shù)是從計算機視覺(jué)誕生出來(lái)以后,再反運用到AI領(lǐng)域中去。

  第三, 計算機視覺(jué)擁有大量的量子AI的應用基礎。

  計算機視覺(jué)技術(shù)的原理

  計算機視覺(jué)就是用各種成象系統代替視覺(jué)器官作為輸入敏感手段,由計算機來(lái)代替大腦完成處理和解釋。計算機視覺(jué)的最終研究目標就是使計算機能象人那樣通過(guò)視覺(jué)觀(guān)察和理解世界,具有自主適應環(huán)境的能力。在實(shí)現最終目標以前,人們努力的中期目標是建立一種視覺(jué)系統,這個(gè)系統能依據視覺(jué)敏感和反饋的某種程度的智能完成一定的任務(wù)。例如,計算機視覺(jué)的一個(gè)重要應用領(lǐng)域就是自主車(chē)輛的視覺(jué)導航,還沒(méi)有條件實(shí)現象人那樣能識別和理解任何環(huán)境,完成自主導航的系統。因此,人們努力的研究目標是實(shí)現在高速公路上具有道路跟蹤能力,可避免與前方車(chē)輛碰撞的視覺(jué)輔助駕駛系統。

  這里要指出的一點(diǎn)是在計算機視覺(jué)系統中計算機起代替人腦的作用,但并不意味著(zhù)計算機必須按人類(lèi)視覺(jué)的方法完成視覺(jué)信息的處理。計算機視覺(jué)可以而且應該根據計算機系統的特點(diǎn)來(lái)進(jìn)行視覺(jué)信息的處理。但是,人類(lèi)視覺(jué)系統是迄今為止,人們所知道的功能最強大和完善的視覺(jué)系統,對人類(lèi)視覺(jué)處理機制的研究將給計算機視覺(jué)的研究提供啟發(fā)和指導。因此,用計算機信息處理的方法研究人類(lèi)視覺(jué)的機理,建立人類(lèi)視覺(jué)的計算理論,也是一個(gè)非常重要和信人感興趣的研究領(lǐng)域。

  這一領(lǐng)域的深入研究是從20世紀50年代開(kāi)始的,走的是三個(gè)方向——即復制人眼;復制視覺(jué)皮層;以及復制大腦剩余部分。

  復制人眼——讓計算機“去看”

  目前做出最多成效的領(lǐng)域就是在“復制人眼”這一領(lǐng)域。在過(guò)去的幾十年,科學(xué)家已經(jīng)打造了傳感器和圖像處理器,這些與人類(lèi)的眼睛相匹配,甚至某種程度上已經(jīng)超越。通過(guò)強大、光學(xué)上更加完善的鏡頭,以及納米級別制造的半導體像素,現代攝像機的精確性和敏銳度達到了一個(gè)驚人的地步。它們同樣可以拍下每秒數千張的圖像,并十分精準地測量距離。

  但是問(wèn)題在于,雖然我們已經(jīng)能夠實(shí)現輸出端極高的保真度,但是在很多方面來(lái)說(shuō),這些設備并不比19世紀的針孔攝像機更為出色:它們充其量記錄的只是相應方向上光子的分布,而即便是最優(yōu)秀的攝像頭傳感器也無(wú)法去“識別”一個(gè)球,遑論將它抓住。

  換而言之,在沒(méi)有軟件的基礎上,硬件是相當受限制的。因此這一領(lǐng)域的軟件才是要投入解決的更加棘手的問(wèn)題。不過(guò)現在攝像頭的先進(jìn)技術(shù),的確為這軟件提供了豐富、靈活的平臺就是了。

  復制視覺(jué)皮層——讓計算機“去描述”

  要知道,人的大腦從根本上就是通過(guò)意識來(lái)進(jìn)行“看”的動(dòng)作的。比起其他的任務(wù),在大腦中相當的部分都是專(zhuān)門(mén)用來(lái)“看”的,而這一專(zhuān)長(cháng)是由細胞本身來(lái)完成的——數十億的細胞通力合作,從嘈雜、不規則的視網(wǎng)膜信號中提取模式。

  如果在特定角度的一條沿線(xiàn)上出現了差異,或是在某個(gè)方向上出現了快速運動(dòng),那么神經(jīng)元組就會(huì )興奮起來(lái)。較高級的網(wǎng)絡(luò )會(huì )將這些模式歸納進(jìn)元模式(meta-pattern)中:它是一個(gè)朝上運動(dòng)的圓環(huán)。同時(shí),另一個(gè)網(wǎng)絡(luò )也相應而成:這次是帶紅線(xiàn)的白色圓環(huán)。而還有一個(gè)模式則會(huì )在大小上增長(cháng)。從這些粗糙但是補充性的描述中,開(kāi)始生成具體的圖像。

  使用人腦視覺(jué)區域相似的技術(shù),定位物體的邊緣和其他特色,從而形成的“方向梯度直方圖”

  由于這些網(wǎng)絡(luò )一度被認為是“深不可測的復雜”,因此 在計算機視覺(jué)研究的早期,采用的是別的方式:即“自上而下的推理”模式——比如一本書(shū)看起來(lái)是“這樣”,那么就要注意與“這個(gè)”類(lèi)似的模式。而一輛車(chē)看起來(lái)是“這樣”,動(dòng)起來(lái)又是“這樣”。

  在某些受控的情況下,確實(shí)能夠對少數幾個(gè)物體完成這一過(guò)程,但如果要描述身邊的每個(gè)物體,包括所有的角度、光照變化、運動(dòng)和其他上百個(gè)要素,即便是咿呀學(xué)語(yǔ)的嬰兒級別的識別,也需要難以想象的龐大數據。

  而如果不用“自上而下”,改用“自下而上”的辦法,即去模擬大腦中的過(guò)程,則看上去前景更加美好:計算機可以在多張圖中,對一張圖片進(jìn)行一系列的轉換,從而找到物體的邊緣,發(fā)現圖片上的物體、角度和運動(dòng)。就像人類(lèi)的大腦一樣,通過(guò)給計算機觀(guān)看各種圖形,計算機會(huì )使用大量的計算和統計,試著(zhù)把“看到的”形狀與之前訓練中識別的相匹配。

  科學(xué)家正在研究的,是讓智能手機和其他的設備能夠理解、并迅速識別出處在攝像頭視場(chǎng)里的物體。如上圖,街景中的物體都被打上了用于描述物體的文本標簽,而完成這一過(guò)程的處理器要比傳統手機處理器快上120倍。

  隨著(zhù)近幾年并行計算領(lǐng)域的進(jìn)步,相關(guān)的屏障逐漸被移除。目前出現了關(guān)于模仿類(lèi)似大腦機能研究和應用的爆發(fā)性增長(cháng)。模式識別的過(guò)程正在獲得數量級的加速,我們每天都在取得更多的進(jìn)步。

  復制大腦剩余部分——讓計算機“去理解”

  當然,光是“識別”“描述”是不夠的。一臺系統能夠識別蘋(píng)果,包括在任何情況、任何角度、任何運動(dòng)狀態(tài),甚至是否被咬等等等等。但它仍然無(wú)法識別一個(gè)橘子。并且它甚至都不能告訴人們:啥是蘋(píng)果?是否可以吃?尺寸如何?或者具體的用途。

  前面說(shuō)過(guò),沒(méi)有軟件,硬件的發(fā)揮非常受限。但現在的問(wèn)題是,即便是有了優(yōu)秀的軟硬件,沒(méi)有出色的操作系統,也“然并卵”。

  對于人們來(lái)說(shuō),大腦的剩余部分由這些組成,包括長(cháng)短期記憶、其他感官的輸入、注意力和認知力、從世界中萬(wàn)億級別的交互中收獲的十億計知識,這些知識將通過(guò)我們很難理解的方式,被寫(xiě)入互聯(lián)的神經(jīng)。而要復制它,比起我們遇到過(guò)的任何事情都要更加復雜。

  計算機視覺(jué)的應用領(lǐng)域

  計算機視覺(jué)的應用領(lǐng)域主要包括對照片、視頻資料如航空照片、衛星照片、視頻片段等的解釋、精確制導、移動(dòng)機器人視覺(jué)導航、醫學(xué)輔助診斷、工業(yè)機器人的手眼系統、地圖繪制、物體三維形狀分析與識別及智能人機接口等。

  早期進(jìn)行數字圖像處理的目的之一就是要通過(guò)采用數字技術(shù)提高照片的質(zhì)量,輔助進(jìn)行航空照片和衛星照片的讀取判別與分類(lèi)。由于需要判讀的照片數量很多,于是希望有自動(dòng)的視覺(jué)系統進(jìn)行判讀解釋,在這樣的背景下,產(chǎn)生了許多航空照片和衛星照片判讀系統與方法。自動(dòng)判讀的進(jìn)一步應用就是直接確定目標的性質(zhì),進(jìn)行實(shí)時(shí)的自動(dòng)分類(lèi),并與制導系統相結合。目前常用的制導方式包括激光制導、電視制導和圖像制導,在導彈系統中常常將慣性制導與圖像制導結合,利用圖像進(jìn)行精確的末制導。

  工業(yè)機器人的手眼系統是計算機視覺(jué)應用最為成功的領(lǐng)域之一,由于工業(yè)現場(chǎng)的諸多因素,如光照條件、成像方向均是可控的,因此使得問(wèn)題大為簡(jiǎn)化,有利于構成實(shí)際的系統。與工業(yè)機器人不同,對于移動(dòng)機器人而言,由于它具有行為能力,于是就必須解決行為規劃問(wèn)題,即是對環(huán)境的了解。隨著(zhù)移動(dòng)式機器人的發(fā)展,越來(lái)越多地要求提供視覺(jué)能力,包括道路跟蹤、回避障礙、特定目標識別等。目前移動(dòng)機器人視覺(jué)系統研究仍處于實(shí)驗階段,大多采用遙控和遠視方法。

  在醫學(xué)上采用的圖像處理技術(shù)大致包括壓縮、存儲、傳輸和自動(dòng)/輔助分類(lèi)判讀,此外還可用于醫生的輔助訓練手段。與計算機視覺(jué)相關(guān)的工作包括分類(lèi)、判讀和快速三維結構的重建等方面。長(cháng)期以來(lái),地圖繪制是一件耗費人力、物力和時(shí)間的工作。以往的做法是人工測量,現在更多的是利用航測加上立體視覺(jué)中恢復三維形狀的方法繪制地圖,大大提高了地圖繪制的效率。同時(shí),通用物體三維形狀分析與識別一直是計算機視覺(jué)的重要研究目標,并在景物的特征提取、表示、知識的存儲、檢索以及匹配識別等方面都取得了一定的進(jìn)展,構成了一些用于三維景物分析的系統。

  近年來(lái),基于生物特征(biometrics)的鑒別技術(shù)得到了廣泛重視,主要集中在對人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺(jué)信息有關(guān)。與生物特征識別密切相關(guān)的另一個(gè)重要應用是用于構成智能人機接口?,F在計算機與人的交流還是機械式的,計算機無(wú)法識別用戶(hù)的真實(shí)身份,除鍵盤(pán)、鼠標外,其他輸入手段還不成熟。利用計算機視覺(jué)技術(shù)可以使計算機檢測到用戶(hù)是否存在、鑒別用戶(hù)身份、識別用戶(hù)的體勢(如點(diǎn)頭、搖頭)。此外,這種人機交互方式還可推廣到一切需要人機交互的場(chǎng)合,如入口安全控制、過(guò)境人員的驗放等。



關(guān)鍵詞: 人工智能 計算機視覺(jué)

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>