<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 蘋(píng)果推高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

蘋(píng)果推高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

作者: 時(shí)間:2017-09-28 來(lái)源:量子位 收藏

  在手機、平板和可穿戴設備不斷普及的今天,比以往任何時(shí)候都重要。但這并非易事,拿漢字來(lái)說(shuō),讓移動(dòng)設備識別大量手寫(xiě)漢字字符還是個(gè)挑戰。

本文引用地址:http://dyxdggzs.com/article/201709/364988.htm

  今天,機器學(xué)習博客發(fā)表文章《Real-Time Recognition of Handwritten Chinese Characters Spanning a Large Inventory of 30,000 Characters》,介紹了如何在iPhone、iPad和Apple Watch的Scribble模式中解決上述問(wèn)題。

  這套基于深度學(xué)習的識別系統,能準確處理多達3萬(wàn)個(gè)字符。為了提高準確性,研究人員還特別注意了數據的收集環(huán)境、典型字體和訓練方案。他們發(fā)現,這套系統還能支持更大的字符庫。

  蘋(píng)果研究人員的實(shí)驗表明,只要訓練數據集的數量夠大質(zhì)量夠好,準確率只會(huì )隨著(zhù)字符量的增加緩慢下降。量子位將這篇博客中的要點(diǎn)翻譯整理,與大家分享——

  

蘋(píng)果推出高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

 

  簡(jiǎn)介

  能夠提高用戶(hù)在移動(dòng)設備上的體驗,尤其適用于漢字這種相對復雜文字的使用者。由于漢字數量和書(shū)寫(xiě)樣式多,確實(shí)是個(gè)大挑戰。

  字母類(lèi)的語(yǔ)言也就涉及到100多個(gè)字母的排列順序,但在中國國家標準GB 18030-2005《信息技術(shù)中文編碼字符集》中就收錄了27533個(gè)字符。

  日常生活中,人們只用得到最具代表性的一小部分。因此,國標GB2312-80《信息交換用字符編碼字符集·基本集》中僅包含6763個(gè)字符。中科院自動(dòng)化研究所創(chuàng )建的CASIA數據庫中所用字符有6763個(gè),其中一級字符(常用字)3755個(gè),二級字符(非常用字)3008個(gè)。

  然而,早期識別算法主要依賴(lài)分析筆畫(huà)的構造。后來(lái),研究人員對研究漢字整體結構的方法產(chǎn)生了興趣。由于眾多漢字具有相似性,漢字識別的難度加大,研究人員通過(guò)分類(lèi)降低錯誤識別。

  在MNIST數據集的拉丁文任務(wù)中,卷積神經(jīng)網(wǎng)絡(luò )(CNN)嶄露頭角。因為訓練數據足夠大,根據需要補充合成樣例,CNN無(wú)疑是最好的方法。美中不足的是,這些研究中分的類(lèi)別很少。

  當我們開(kāi)始研究漢字的大規模識別時(shí),CNN似乎是個(gè)不錯的選擇。但這種方法需要將CNN擴展至約3萬(wàn)個(gè)字符,并且在嵌入設備上實(shí)時(shí)保持性能。

  

蘋(píng)果推出高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

 

  系統結構

  我們采用的是CNN通用架構,類(lèi)似于之前在MNIST上手寫(xiě)識別實(shí)驗中的架構。系統結構如圖所示:

  

蘋(píng)果推出高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

  △典型的CNN架構

  出于性能原因,我們將輸入設定為一個(gè)中等分辨率的圖像(48x48像素),這是普通手寫(xiě)漢字的大小。之后我們將它輸入至特征提取層,交替進(jìn)行卷積和子采樣。最后一個(gè)特征提取層通過(guò)全連接層輸出。

  從一個(gè)卷積層到下一個(gè)卷積層,我們選擇了kernel的大小和特征映射的數量得出粗粒度特征。通過(guò)用2x2 kernel,我們對最大池化層進(jìn)行了采樣,每個(gè)輸出層都有一個(gè)節點(diǎn)。

  下圖展示了使用CNN的運行結果,其中“Hz-1”指的是一級字符庫(3755個(gè)字符),“CR(n)”表示輸入法界面排序為n的可能字符的準確度。除了常見(jiàn)的“最可能字”(top-1)和top-10的準確性外,我們也特意提到了top-4的準確性,因為輸入法界面一開(kāi)始會(huì )顯示4個(gè)可能漢字,而top-4的準確性是用戶(hù)體驗提升的重要指標。

  

蘋(píng)果推出高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

  △在CASIA在線(xiàn)數據庫3755個(gè)字符上的運行結果

  除此以外,我們對在iOS設備內部收集的額外訓練數據感興趣。此數據涵蓋了更多字體樣式,并包含每個(gè)字符大量的訓練實(shí)例。在同一個(gè)有3775個(gè)字符測試集的訓練結果如下:

  

蘋(píng)果推出高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

 

  這次訓練準確度有些許提高,總體來(lái)說(shuō),在測試集中出現的大多數漢字書(shū)寫(xiě)風(fēng)格已經(jīng)在CASIA訓練集中得到了很好覆蓋,也表明折疊訓練數據不會(huì )使準確性下降,附加樣式在對底層模型沒(méi)有負影響。

  擴展至3萬(wàn)字

  我們想為用戶(hù)提供從印刷體到草書(shū)等各種可能的輸入字體。為了盡可能多涵蓋不同的漢字書(shū)寫(xiě)風(fēng)格,我們從中國幾個(gè)地區找到了一些書(shū)法家的數據。讓我們驚訝的是,大多數用戶(hù)表示沒(méi)有見(jiàn)過(guò)這些罕見(jiàn)的漢字。

  因此,我們又收集了不同年齡段、性別和不同教育背景的用戶(hù)數據,發(fā)現了各種各樣的書(shū)寫(xiě)風(fēng)格。下圖顯示了樣例中“花”字在楷書(shū)、草書(shū)和“隨便畫(huà)幾筆”風(fēng)格下的樣本。

  

蘋(píng)果推出高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

 

  事實(shí)上,在日常生活中,用戶(hù)輸入經(jīng)常是“隨便畫(huà)幾筆”,出現一種非常不相似的曲線(xiàn)變化。有時(shí)也會(huì )讓系統混淆成其他字符。下圖展示了我們在數據中觀(guān)察到的一些具體例子。需要注意的是,有足夠的訓練數據能區分像Figure 7這樣的草書(shū)變化很重要。

  

蘋(píng)果推出高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

 

  用這種方法,我們收集了大量漢字,將可識別字符從3755增加到大約3萬(wàn)。

  

蘋(píng)果推出高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

  △30000個(gè)字符在CASIA在線(xiàn)數據庫的結果

  為了解系統如何支持30000個(gè)手寫(xiě)字符識別,我們還在許多不同測試集上對其進(jìn)行評估,這些測試集支持所有字體的字符。平均測試結果如下:

  

蘋(píng)果推出高精度手寫(xiě)識別系統,可準確識別3萬(wàn)字符集

  △不同字體的30000個(gè)字符在多個(gè)內部測試集的平均結果

  當然,上面兩張圖的結果不能直接比較,因為它們屬于不同的測試集上。但我們能發(fā)現,top-1和top-4的準確性相當,top-4達到了95.1%的準確率,結果尚好。

  綜上所述,我們在嵌入式設備上構建了覆蓋3萬(wàn)個(gè)字符的高精度手寫(xiě)識別系統。只要有足夠數量和質(zhì)量的訓練數據,識別準確度就不會(huì )大幅降低。未來(lái),我們能精確識別的漢字字符還會(huì )更多。



關(guān)鍵詞: 蘋(píng)果 手寫(xiě)識別

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>