機器學(xué)習的崛起:從無(wú)人駕駛到AI醫療,人們已進(jìn)入深度學(xué)習的新世界
語(yǔ)音識別:實(shí)時(shí)跨文化交流不再遙遠
本文引用地址:http://dyxdggzs.com/article/201901/396937.htm人工智能的另一只圣杯是語(yǔ)音識別。不久之前,計算機的獨立語(yǔ)音識別應用領(lǐng)域還很有限,如機票預訂。而如今,限制已不復存在。2012 年,一名來(lái)自多倫多大學(xué)的實(shí)習生在微軟研究院(Microsoft Research)的一個(gè)夏季研究項目中,讓微軟的語(yǔ)音識別系統性能得到了顯著(zhù)的提升。2016 年,微軟的一個(gè)團隊宣布,他們開(kāi)發(fā)的一個(gè)擁有120 層的深度學(xué)習網(wǎng)絡(luò )已經(jīng)在多人語(yǔ)音識別基準測試中達到了與人類(lèi)相當的水平。
這一突破性成果將在之后的幾年逐漸影響我們的社會(huì ),計算機鍵盤(pán)會(huì )被自然語(yǔ)言接口取代。隨著(zhù)數字助手,如亞馬遜的Alexa、蘋(píng)果的Siri 以及微軟的Cortana 先后進(jìn)入千家萬(wàn)戶(hù),這種取代已經(jīng)在發(fā)生了。就如隨著(zhù)個(gè)人電腦的普及,打字機退出了歷史舞臺,有一天電腦鍵盤(pán)也將成為博物館的展品。
當語(yǔ)音識別和語(yǔ)言翻譯結合到一起時(shí),實(shí)時(shí)的跨文化交流將有可能實(shí)現?!缎请H迷航》中那種萬(wàn)能翻譯機將觸手可及。為什么計算機語(yǔ)音識別和語(yǔ)言翻譯達到人類(lèi)的水平要花這么久的時(shí)間?難道計算機的各種認知能力同時(shí)進(jìn)入瓶頸期僅僅是巧合嗎?其實(shí)所有這些突破都源于大數據的出現。
AI 醫療:醫學(xué)診斷將更加準確
深入皮膚
隨著(zhù)機器學(xué)習的成熟并被應用于可獲取大數據的許多其他問(wèn)題,服務(wù)行業(yè)和其相關(guān)職業(yè)也將發(fā)生轉變?;跀蛋偃f(wàn)患者病情記錄的醫學(xué)診斷將變得更加準確。最近的一項研究將深度學(xué)習運用到了囊括超過(guò)2000 種不同疾病的13 萬(wàn)張皮膚病學(xué)圖像中,這個(gè)醫學(xué)數據庫是以前的10 倍大。該研究的網(wǎng)絡(luò )被訓練用于診斷“測試集”(test set,它從未見(jiàn)過(guò)的新圖像集)中的各種疾病。它在新圖像上的診斷表現與21 位皮膚科專(zhuān)家的結論基本一致,甚至在某些情況下還要更準確。在不久的將來(lái),任何一個(gè)擁有智能手機的人都可以拍下疑似皮膚病變的照片,并立即進(jìn)行診斷——而現在要完成同樣的過(guò)程,我們需要先去看醫生,耐心等待病變被專(zhuān)家篩查出來(lái),然后再支付一大筆賬單。這一進(jìn)步將大大擴大皮膚病護理的范圍,提升護理質(zhì)量。如果個(gè)體可以很快得到專(zhuān)家診斷,他們會(huì )在皮膚病的早期階段,也就是更容易治療的時(shí)候就開(kāi)始就醫。借助深度學(xué)習,所有的醫生都將更準確地診斷罕見(jiàn)的皮膚病。
深入癌癥
如果專(zhuān)家在轉移性乳腺癌的淋巴結活檢切片圖像上判斷錯誤,就有可能導致致命的后果。這是一種深度學(xué)習擅長(cháng)的模式識別問(wèn)題。實(shí)際上,一個(gè)經(jīng)過(guò)大量結論清晰的切片數據訓練出來(lái)的深度學(xué)習網(wǎng)絡(luò )能達到0.925 的準確度,還不錯,但還不及人類(lèi)專(zhuān)家在同一測試集上達到的0.966。然而,把深度學(xué)習與人類(lèi)專(zhuān)家的預測結合起來(lái),準確度達到了0.995,幾近完美。由于深度學(xué)習網(wǎng)絡(luò )和人類(lèi)專(zhuān)家查看相同
的數據的方式不同,二者相結合的效果比單獨預測要好。這樣一來(lái),更多的生命得以被挽救。這表明在未來(lái),人類(lèi)與機器將是合作而非競爭的關(guān)系。
深入睡眠
如果你有嚴重的睡眠問(wèn)題(70% 的人一生中都會(huì )遇到這個(gè)問(wèn)題),你要等待幾個(gè)月才能見(jiàn)到你的醫生(除非問(wèn)題十分緊急),然后你會(huì )被轉到一個(gè)睡眠診所。在那里,你需要在身上接幾十個(gè)能在你入睡時(shí)記錄你的腦電圖(EEG)和肌肉活動(dòng)的電極,接受徹夜觀(guān)察。每個(gè)晚上,你會(huì )先進(jìn)入慢波睡眠,然后定期進(jìn)入快速眼動(dòng)(REM)睡眠,在此期間,你會(huì )做夢(mèng),但是失眠、睡眠呼吸暫停綜合征、不寧腿綜合征以及許多其他睡眠障礙會(huì )干擾這種睡眠模式。如果你在家里就很難入睡,那么在一張陌生的床上,全身接滿(mǎn)了讓人不安的醫療設備進(jìn)入睡眠狀態(tài),絕對算得上真正的挑戰。睡眠專(zhuān)家會(huì )查看你的腦電圖記錄,以30 秒為單位標記睡眠階段,一段8 小時(shí)的睡眠要花幾個(gè)小時(shí)才能標記完。而最終你會(huì )得到一份有關(guān)睡眠模式異常情況的報告,以及一份2000 美元的賬單。
依據1968 年由安東尼·雷希特施芬(Anthony Rechtshaffen)和艾倫·卡萊斯(Alan Kales)設計的系統,睡眠專(zhuān)家將接受尋找表征不同睡眠階段特征跡象的培訓。但是由于這些特征常常不明確,也不一致,只有75% 的情況下專(zhuān)家們能在數據解讀上達成一致。相比之下,我實(shí)驗室之前的一名研究生菲利普·洛(Philip Low)使用無(wú)監督機器學(xué)習,花了不到一分鐘的計算機運算時(shí)間,以3 秒的時(shí)間分辨率自動(dòng)檢測睡眠階段,和87%的人類(lèi)專(zhuān)家達成了一致的結論。此外,這種方式只需要在頭部的單個(gè)位置做記錄,用不到那些觸點(diǎn)和接線(xiàn),也節省了大量佩戴和摘除的時(shí)間。2007 年,我們創(chuàng )立了一家公司Neurovigil,想將這項技術(shù)引入睡眠診所,但診所對此沒(méi)有表現出多大興趣,因為靠人力標注能產(chǎn)生更多的現金流。實(shí)際上,依據保險號向患者開(kāi)具賬單,會(huì )讓診所沒(méi)有動(dòng)機采用更廉價(jià)的程序。Neurovigil 在大型制藥公司發(fā)現了另一個(gè)市場(chǎng),這些公司在開(kāi)展臨床試驗,需要測試他們的藥物對睡眠模式的影響。這項技術(shù)目前正在進(jìn)入長(cháng)期護理設施市場(chǎng),幫助解決在老年人中更普遍的進(jìn)行性睡眠問(wèn)題。
睡眠診所模式是存在缺陷的,因為在這樣的限制條件下不能可靠地診斷出健康問(wèn)題:每個(gè)人的生理基數都不同,而偏離這個(gè)基數的信息最重要。Neurovigil 已經(jīng)有了一個(gè)小型設備iBrain,它可以在家里記錄你的腦電圖信息,將數據傳到網(wǎng)上并分析數據的長(cháng)期趨勢和異常情況。這可以幫助醫生及早發(fā)現健康問(wèn)題,在惡化前及時(shí)干預并阻止慢性疾病的發(fā)展。其他很多疾病的治療也將受益于持續監測,如1 型糖尿病,血糖水平可以被監測并通過(guò)胰島素進(jìn)行調節。使用能夠連續記錄數據的廉價(jià)傳感器正在對其他慢性疾病的診斷和治療產(chǎn)生重大影響。
從Neurovigil 的發(fā)展過(guò)程中可以看出:
第一,即便擁有更好更廉價(jià)的技術(shù),也不代表能輕易地將其轉化為有市場(chǎng)價(jià)值,甚至更優(yōu)質(zhì)的新產(chǎn)品或服務(wù);
第二,當現有產(chǎn)品在市場(chǎng)中的地位根深蒂固,就會(huì )進(jìn)一步開(kāi)發(fā)出深入應用的二級市場(chǎng),可以讓新技術(shù)產(chǎn)生更直接的影響,并爭取時(shí)間來(lái)改進(jìn),提升競爭力。太陽(yáng)能和許多其他新興產(chǎn)業(yè)的技術(shù)就是這樣進(jìn)入市場(chǎng)的。從長(cháng)遠來(lái)看,已被證實(shí)具有優(yōu)勢的睡眠監測和新技術(shù)將會(huì )覆蓋到家中的患者,并最終融入醫療實(shí)踐。
評論