2017年2月15日 星期三

一個人出版:三家OCR辨識比較

  以下只提供一個頁面,由於要掃描的稿子太多,不得不砸錢買了一套Abby Reader 14(最新版),結果一測試之後,效果還是令人搖頭。於是本來打算自己寫程式接入Google開源的OCR Tesseract,結果發現 Adobe Acrobat Pro DC也有這個功能,於是就一併測試了一下。提供以下的結果讓讀者參考,一來告知讀者當代的最高科技也就只能做到這個地步,二來告知讀者目前出一本公版書的成本仍然很高!若有遇到喜歡的電子書,記得購買支持!至於微軟的上次已經測試過,效果很糟,就不再測試!這是距離上次一年後的測試結果!進步有限啊!還是Google最強,因此如果要大批量的辨識,只能自己寫程式運用Tesseract了!

辨識頁面


Abby Reader 14 辨識結果


我去了兩個屋期才阎來,知道了我的保護人已在三天之前到了盧勒登播C我受了 他們一種完全出我意外的歡迎。將軍冷冷地注視我,用肴甯可說是傲慢的態度招呼 我,並且辭却我向他的妹子的致敬。他已經從甚麽地方弄到了錢,那是顯然的事實。 我以爲我能夠在將軍的眼光中找出害羞盹神色。瑪麗亞•菲里波芙娜,也好像心慌意 亂,和我說話總帶看淡淡的神氣。然而,她拿了我遞給她的錢,數着,諦聽着我所說 的話語。那天來赴宴會的是一位法國先生米正沙夫,和!位法國小姐,還有i個英國

Adobe Acrobat Pro DC 辨識結果


我去了兩個是期才囘* '郟這了我的保護人已在三天之前到i了 I。我受了
他們一種完全出我滔外的歡迎o  將軍冷冷地注説找 , 用着甯可說是傲慢的熊度招呼我, 並且辭却我向他的妹子的致敬o  他已經從甚麼地方弄到了錢, 那是顓然的求實o我以為我能夠在將軍的眼光中找出害羕的神色o  瑪麗亞· 菲里波芙娜, 也好像心慌意
亂, 和我說話總帶看淡淡的神氣。然而, 她拿了我遞給她的錢, 數着, 諦聽看我所說
的話語o  那天來赴宴會的是一位祛國先生11 , 和一位法國小姐, 遠有 i   個英國

Google doc 辨識結果


我去了兩個星期才回來,知道了我的保護人已在三天之前到了盧勒登堡。我受了 他們一種完全出我意外的歡迎。將軍冷冷地注親我,用著雷可說是傲慢的態度招呼 我,並且辭邦我向他的妹子的致敬。他已經從甚麼地方弄到了錢,那是顯然的事實。 我以為我能夠在將軍的眼光中找出害羞的神色。瑪麗亞·弗里被漢娜,也好* 亂,和我說話總帶著淡淡的神氣。然而,她拿了我遞給她的錢,數者,論體著我所說 的話語。那天來赴宴會的是一位法國先生米正沙夫,和一位法國小姐,還有一個英國

沒有留言:

張貼留言