2016年4月14日 星期四

一個人出版:個人電子書出版流程二:校對技術

  校對一向是非常浪費時間的事情,有時候甚至出現甲編輯改完後、乙編輯又改回來的情況,台灣的出版界並沒有統一的用字規範與標準,是造成這種狀況發生的原因之一。許多編輯甚至在缺乏語言文字學的知識的情況下,以Google的搜索數目來決定採用哪一個詞彙,這種荒謬的行徑,相信即使到了這幾年也沒有太大的改善。
  個人研發校對軟體的構想正是在出版社擔任編輯的期間(主要是網路與書),從那時起已經覺得校對是一件很浪費生命的事情。因為很多錯誤其實一而再、再而三的出現(不談改了又被改回的),明顯可以用簡單的辦法進行處理。但所謂的簡單的辦法,只是一種不經過詳細研究所產生的主觀看法。真正實作以後才發現,有很多問題需要解決。光是文本錯誤本身就可以分為上百種之多,但表面上,我們統稱之為「錯誤」!因此事實上一個真正的校對軟體所牽涉到的技術非常廣與雜,資料庫的建立更是其中最難的部份。
  2007年個人對一套校對系統有了比較完整的想法,不過一直拖到2010年左右才有機會開始實作。
  總之,後來個人排除萬難,把軟體寫出來了!先是簡單的赤兔,後是Java介面的南史,最後是Web介面的赤兔(唯一賣出一套的軟體)。接下來要示範的是用南史校對的過程,不過這次挑選的範例有點「失敗」,主因在於校對到後來才發現原始文本有問題。最近都會陸續的發放相關校對示範影片,如果反應不錯的話,個人才會考慮移植到Word上(目前只是有這種想法)。
  目前的版本個人也還不太滿意,主因在於如果要走到「全自動」的地步,必須進行「語義工程」的建構,而這是價值不斐的事情。語義工程的建構非常之難,而應用非常之廣。相關的技術,這裡不再多做討論。
  示範以李劼人《天魔舞》為示範書籍,總共找出九百多個錯誤與非錯誤,花了半小時的時間(其實如果不是分心講解的話,大概只要二十分鐘左右。)修正了八百多個錯誤!
  以下是示範影片:


  由於會陸續釋放相關校對影片,因此其他問題就留待相關影片再說了!

沒有留言:

張貼留言