科大訊飛胡郁:人工智能的發(fā)展未來(lái)與創(chuàng )業(yè)
人工智能的前世今生
本文引用地址:http://dyxdggzs.com/article/201702/343991.htm人工智能這一話(huà)題,最早可以回溯到1946 年世界上第一臺電子計算機 ENIAC 的誕生。ENIAC 產(chǎn)生以后,很多計算機科學(xué)家對于計算機將來(lái)能夠代替人類(lèi)做什么事情有很多聯(lián)想,其中最著(zhù)名的一個(gè)人是圖靈,他在 1950 年左右在人工智能領(lǐng)域進(jìn)行了很多的探討,并且提出了著(zhù)名的“圖靈測試”。而“人工智能”一詞真正被提出來(lái),是在 1956 年Dartmouth 的會(huì )議上,由四位圖靈獎得主、信息論創(chuàng )始人和一位諾貝爾獎得主一起將“人工智能”定義出來(lái),包括明斯基、西蒙、麥卡塞等人,這次會(huì )議也被公認為人工智能研究的出生典禮。
人工智能與機器人的關(guān)系在今天看來(lái),“機器人”一詞出現更早,1920 年就第一次出現了 Robot 這個(gè)詞,原本是蒸汽機械時(shí)代出現的東西,主要基于機械原理,跟計算機數字化、數學(xué)沒(méi)有什么關(guān)系;但在表現形式上有所不同:比如想要開(kāi)家里二樓的燈,如果通過(guò)人工智能,只需要對著(zhù)系統說(shuō)一句,系統就會(huì )從后臺對語(yǔ)音指令進(jìn)行分析并開(kāi)燈;如果是機器人,則需要爬到二樓去把燈打開(kāi)。正本清源,人工智能 (Artificial Intelligence) 是指,能夠和人一樣進(jìn)行感知、認知、決策、執行的人工程序或系統。然而,人工智能發(fā)展的 60 年不是一帆風(fēng)順的,起起伏伏共經(jīng)歷了三次浪潮。
(1)1970 年第一次黃金期。自從Dartmouth 會(huì )議以后,人們陸續發(fā)明了第一款感知神經(jīng)網(wǎng)絡(luò )軟件和聊天軟件,那時(shí)大家都驚呼“人工智能來(lái)了,再過(guò)十年機器要超越人類(lèi)了”。不過(guò),很快到了 70 年代后期,人們發(fā)現過(guò)去的理論和模型,只能解決一些非常簡(jiǎn)單的問(wèn)題,很快人工智能進(jìn)入了第一次的冬天。
(2)1990 年第二次黃金期。隨著(zhù)1982 年 Hopfield 神經(jīng)網(wǎng)絡(luò )和 BP 訓練算法的提出,大家發(fā)現人工智能的春天又來(lái)了。 80 年代又興起一波人工智能的熱潮,包括語(yǔ)音識別、語(yǔ)音翻譯以及日本提出的第五代計算機。不過(guò),到了 90 年代后期,人們發(fā)現這種東西離我們的實(shí)際生活還很遙遠。比如 IBM 在 90 年代時(shí)提出了一款語(yǔ)音聽(tīng)寫(xiě)的軟件叫 IBM Viavoice,在演示當中效果不錯,但是真正用時(shí)卻很難使用。因此,在 2000 年左右第二次人工智能的浪潮又淹沒(méi)了。
(3)現在到了人工智能真正爆發(fā)的前夜。隨著(zhù) 2006 年 Hinton 提出的深度學(xué)習技術(shù),以及在圖像、語(yǔ)音識別和其他領(lǐng)域內取得的一些成功,大家認為經(jīng)過(guò)了兩次起伏,人工智能開(kāi)始進(jìn)入了真正爆發(fā)的前夜??傊?,就國內外人工智能公司這么多年的發(fā)展來(lái)看,使命是內在的,階段性目標是變化的。
人工智能何時(shí)能到來(lái)?
在我看來(lái),人工智能時(shí)代的到來(lái)離不開(kāi)人機交互模式的變革??梢钥吹?,自 60 年代至今,IT 產(chǎn)業(yè)已經(jīng)歷硬件、軟件、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)與人工智能這五大浪潮,當前已進(jìn)入物聯(lián)網(wǎng)產(chǎn)業(yè)萬(wàn)物互聯(lián)的時(shí)代。在無(wú)屏、移動(dòng)、遠場(chǎng)狀態(tài)下,以語(yǔ)音為主,鍵盤(pán)、觸摸等為輔的人機交互時(shí)代正在到來(lái)。目前主要面臨兩種交互:一種是只需要語(yǔ)音即可,比如藍牙音箱、手環(huán)等,語(yǔ)音之外,不需要看到任何信息;另一種是語(yǔ)音+圖像,比如電視上的語(yǔ)音交互、手機等。在這種情況下,觸摸交互的學(xué)術(shù)名詞應該叫做強視覺(jué)呈現的觸摸交互;而語(yǔ)音作為人機交互最自然的方式,將有效促進(jìn)人工智能與各行業(yè)的結合,讓人工智能更容易進(jìn)入大家的生活。除了語(yǔ)音交互,科大訊飛也在研究人臉識別技術(shù),其特色是可以將人臉識別與聲紋識別結合在一起,將聲音與圖片混合,來(lái)做活性檢測。
由此,人工智能也將進(jìn)入“智能 +”的時(shí)代,人工智能與各個(gè)行業(yè)的深入結合蘊含著(zhù)巨大的機會(huì )。除了交互,人工智能還可以用在教育、醫療、智慧城市、出行、司法、安全、金融等眾多領(lǐng)域;同時(shí),它在各個(gè)行業(yè)里可以做一個(gè)最簡(jiǎn)單的事情:就是替代人工。在未來(lái)的 10 年,人工智能會(huì )像技術(shù)的服務(wù)一樣,進(jìn)入到我們的生活當中,每個(gè)人都將離不開(kāi)。
那么人工智能如何得以實(shí)現?在這里,我將人工智能的演進(jìn)發(fā)展分成三個(gè)階段:計算智能(能存會(huì )算)、感知智能(能聽(tīng)會(huì )說(shuō),能看會(huì )認)和認知智能(能理解會(huì )思考)。計算智能就是計算機與人類(lèi)比存儲、比記憶,在此方面已經(jīng)遠遠超過(guò)人類(lèi)了。不過(guò),在感知層面,計算機在語(yǔ)音、圖像識別等方面與人類(lèi)還有較大差距,讓計算機真正能理解、會(huì )思考、進(jìn)行自我學(xué)習,還是很欠缺的。只有實(shí)現認知智能的突破,AI 才能部分取代腦力勞動(dòng)。
人工智能與創(chuàng )業(yè)
2016 年,人工智能產(chǎn)業(yè)得到了長(cháng)足的發(fā)展,收獲了不少成功的案例。這里,我認為至少有三個(gè)因素促進(jìn)了人工智能在產(chǎn)業(yè)界的成功:深度神經(jīng)網(wǎng)絡(luò )、大數據以及漣漪效應。
(1)深度神經(jīng)網(wǎng)絡(luò )。其模型和算法相對于傳統的方法,有著(zhù)本質(zhì)的不同;雖然它與我們人類(lèi)的神經(jīng)網(wǎng)絡(luò )相比,還有很多不足,但是確實(shí)在架構和描述方面有其強大之處。
(2)大數據。隨著(zhù)移動(dòng)互聯(lián)網(wǎng)的迅猛發(fā)展,數據每天都是以指數級增加:通過(guò)手機、微信等工具和軟件,人們可以隨時(shí)隨地把視覺(jué)、聽(tīng)覺(jué)上的這些數據輕松地傳到網(wǎng)上,匯聚起來(lái)形成大數據。
(3)漣漪效應。隨著(zhù)移動(dòng)互聯(lián)網(wǎng)的發(fā)展,各種軟件、各種設備接觸用戶(hù)的門(mén)檻極大地降低了。例如,當一款新的 APP 找到第一批用戶(hù)時(shí),他們的使用行為和個(gè)人數據就被后臺記錄下來(lái),開(kāi)發(fā)者再對這種行為和記錄進(jìn)行迭代改進(jìn);當再把 APP投向第二批用戶(hù)時(shí),軟件的性能已經(jīng)比第一代產(chǎn)品有了較大提升,這就是漣漪效應。
可以說(shuō),漣漪效應推動(dòng)了語(yǔ)音辨識與圖片識別的發(fā)展,特別是語(yǔ)音識別的實(shí)用化,更是得益于“漣漪效應”。科大訊飛在 2010 年推出語(yǔ)音識別產(chǎn)品時(shí),識別率只有 60% 左右,剛開(kāi)始大家都覺(jué)得很難用,但是有一批嘗鮮的用戶(hù)。隨著(zhù)技術(shù)的迭代、更新,以及數據持續的迭代,如今訊飛語(yǔ)音識別率已經(jīng)提高到 95% 以上,達到了完全實(shí)用的狀態(tài)。圖像識別技術(shù)也同樣如此,ImageNet 圖像識別任務(wù)在 2012 年時(shí)錯誤率高達 26.2%,但是到 2015 年底已經(jīng)降到了 3.57%?;旧峡梢哉f(shuō),圖像識別技術(shù)的發(fā)展使得我們只要通過(guò)一個(gè)攝像頭,就能將家中的各種物體很輕易地分辨出來(lái)。
因此,可以得出兩點(diǎn)結論:深度神經(jīng)網(wǎng)絡(luò )與大數據的結合已成為當前主流路徑;而基于互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的“研究—工程—產(chǎn)品—用戶(hù)”的閉環(huán)優(yōu)化加速了產(chǎn)品迭代優(yōu)化的進(jìn)程。
當然,對于人工智能領(lǐng)域的創(chuàng )業(yè)者來(lái)說(shuō),產(chǎn)品創(chuàng )新、系統創(chuàng )新以及商業(yè)模式的創(chuàng )新也都是非常重要的。從技術(shù)層面看,產(chǎn)品創(chuàng )新與系統創(chuàng )新是相對立存在的,產(chǎn)品創(chuàng )新可以是一些微創(chuàng )新,而系統創(chuàng )新所需的資金和時(shí)間耗費都很大,從沒(méi)有到開(kāi)始立項,到最后商用需要 15~20 年,基本上創(chuàng )業(yè)者一輩子只能做出一個(gè)。從公司競爭角度看,現在的人工智能公司競爭不是單獨兩個(gè)公司,而是生態(tài)系統的競爭。比如創(chuàng )業(yè)公司很難獨立把人工智能做好,于是各大公司都要做人工智能平臺,包括科大訊飛的語(yǔ)音開(kāi)放平臺,現在已有 23 萬(wàn)開(kāi)發(fā)者,每天服務(wù) 30~35 億次,連接的數目達 90 多億。
同時(shí),在這個(gè)過(guò)程中,商業(yè)模式的創(chuàng )新非常重要,即好的技術(shù)創(chuàng )新一定要配合好的商業(yè)模式創(chuàng )新。高科技企業(yè)的早期市場(chǎng)和主流市場(chǎng)之間存在著(zhù)一條巨大的“鴻溝”,能否順利跨越鴻溝并進(jìn)入主流市場(chǎng),成功贏(yíng)得實(shí)用主義者的支持,就決定了一項高科技產(chǎn)品的成敗。破壞性創(chuàng )新之父——克里斯坦森提出:“大公司卓越有效的管理對于延續性創(chuàng )新的成功具有決定性的作用,而破壞式創(chuàng )新能夠讓創(chuàng )業(yè)公司和小公司擁有顛覆現有產(chǎn)業(yè)鏈的能力!”
最后,我想給創(chuàng )業(yè)者提點(diǎn)個(gè)人建議:去玩兒的事業(yè)一定是你真心喜歡的事情,如果你去玩兒還不選你喜歡的事情,我想你一定是神經(jīng)病;去玩兒的事業(yè),一定要跟你喜歡的人一起去做,玩耍的過(guò)程比結果更重要。謀事在人成事在天,能成為馬云和馬化騰是歷史的必然,但成為這兩個(gè)具體的人一定有很多未然的因素;改變你能改變的,接受你不能改變的。所以,我覺(jué)得人工智能創(chuàng )業(yè)不管是做系統創(chuàng )新,還是做產(chǎn)品創(chuàng )新、微創(chuàng )新,我們要以這樣的心態(tài),真正去享受到我們生活中的每一個(gè)小細節,同時(shí)要有使命感與宏偉藍圖!
評論