TH-OCR文字識別系統介紹
一.TH-OCR
TH-OCR是英文Optical Character Recognition的縮寫(xiě),意思為光學(xué)字符識別,通稱(chēng)為文字識別,它的工作原理為通過(guò)掃描儀或數碼相機等光學(xué)輸入設備獲取紙張上的文字圖片信息,利用各種模式識別算法分析文字形態(tài)特征,判斷出漢字的標準編碼,并按通用格式存儲在文本文件中,由此可以看出,OCR實(shí)際上是讓計算機認字,實(shí)現文字自動(dòng)輸入。它是一種快捷、省力、高效的文字輸入方法。
TH-OCR的突出特點(diǎn):
◇ 漢英雙語(yǔ)同時(shí)混排,識別率最高,居世界領(lǐng)先水平。
◇ 可以識別黑白、灰度、彩色圖像,可以讀取多種圖像格式。
◇ 首創(chuàng )對識別結果進(jìn)行電子文檔版面復原功能,所見(jiàn)即所得。
◇ 首創(chuàng )日文、韓文、日英混排、韓英混排識別功能,識別率98%以上。
TH-OCR的幾大優(yōu)勢:
1. 是唯一可以識別2萬(wàn)多漢字的多體文字識別系統,漢字識別國內最優(yōu)。
2. 漢字和英文混排、日文和英文混排、韓文和英文混排同時(shí)識別。
3. 漢字識別率最高。文通TH-OCR經(jīng)過(guò)"863"智能專(zhuān)家組對數十萬(wàn)字的指標評測和中國軟件評測中心對產(chǎn)品的嚴格測試,識別正確率超過(guò)99.5%,代表了目前印刷體文字識別的最高水平。
4. 支持多種環(huán)境接口。文通TH-OCR支持WINDOWS環(huán)境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多種內碼,可以用于 WINDOWS NT和WINDOWS 98/2000/XP,適合全球各個(gè)地區使用。TH-OCR還具有自學(xué)習功能,不論什么生僻字,都可以通過(guò)鍵盤(pán)輸入進(jìn)行學(xué)習,大大拓寬了OCR系統的識別字符集。
二.漢王OCR文本王
漢王文本王。漢王文本王是漢王公司采用最新的印刷體字符識別技術(shù),集成文本閱讀校對開(kāi)發(fā)的一套高效輸入、快捷辦公的精品軟件系統。漢王文本王識別率高,識別速度快,并且為用戶(hù)定制了多種簡(jiǎn)捷的工作模式:自動(dòng)、單步智能工作模式和專(zhuān)業(yè)批量工作模式自由選擇。相信會(huì )成為您辦公的好助手。
技術(shù)指標:
● 識別字符:
簡(jiǎn)體字符集:國標GB2312-80的全部一、二級漢字6800多個(gè)。
純英文字符集。
簡(jiǎn)繁字集:除了簡(jiǎn)體漢字外,還可以混識臺灣繁體字5400多個(gè)以及香港繁體字。
● 識別字體種類(lèi):
能識別宋體、仿宋、楷、黑、魏碑、隸書(shū)、圓體、行楷等一百多種字體,并支持多種字體混排。
● 識別字號:
初號——小六號字體。
● 表格識別:
可以自動(dòng)判斷、識別各種通用型印刷體表格。電子表格還原準確精美,輸出的電子表格可隨意編輯。
● 正確識別率:
一般的識別條件下,對印刷體文稿都能達到很高的識別正確率。
● 識別速度:
在PII-233計算機上,印刷文稿識別速度達120字/秒。
產(chǎn)品特點(diǎn):
1.智能識別,準確無(wú)誤:全智能化識別核心,識別速度快,識別效率高
2.一鍵掃入,WORD輸出:用戶(hù)操作簡(jiǎn)單快捷,與WORD無(wú)縫連接,只需輕松按下一鍵,文檔自動(dòng)輸出到WORD
3.多種模式,任君選擇:用戶(hù)可根據工作需要或個(gè)人習慣選擇自動(dòng)、單步智能工作模式或專(zhuān)業(yè)批量工作模式
4.復雜版面,自動(dòng)分析:智能分析各種中、英、繁、表、圖混排格式的文本,無(wú)需過(guò)多人工干預
5.表格輸入,輕松實(shí)現:多樣化的表格判識,完美精確的表格還原,瞬間即可轉化成為可任意編輯的電子表格
6.批量輸入,快速高效:大批量的文件掃描,全自動(dòng)化的文字識別,速度快,效率更高
7.版面還原,原文重現:精確保留了原版面格式,準確恢復文本原貌
8.文件保存,多種格式:識別完的文檔可以保存為多種格式(PDF、HTML、RTF、XLS、TXT)的文件,方便實(shí)用
9.工程管理,更加輕松:工程文件方便管理,工作進(jìn)度隨時(shí)保存,打開(kāi)工程文件即可繼續工作
10.文本朗讀、翻譯,省時(shí)省力:漢王閱讀小精靈,避免眼睛疲勞,讓您隨心所欲聽(tīng);翻譯軟件助您跨越語(yǔ)言障礙
三維掃描儀相關(guān)文章:三維掃描儀原理
評論