2016年4月5日 星期二

一個人出版:個人電子書出版流程一:情報與文本


  這個系列的短篇是用來介紹個人如何從無到有出版電子書的。廢話不多說。
  關於如何選定出版平台(Google或Apple或其他)?如何取得帳號?如何取得ITIN或EIN,網路上都有非常多的教學,不再贅述。個人目前只在Google play books上面出版電子書。由於個人目前已經出版一千多本公版書,因此以下也以從如何取得公版書文本,到最終將其出版成電子書為主要內容。

版權法

要出版公版電子書首先得明白哪些書籍已經進入公共領域?由於每一個國家的版權法規定不同,因此必須先理解各國的版權法。美國、英國、中國是個人公版書的主要源頭:
  根據美國最新的版權法規定,著作權的保護期限是直到作者死後70年,這比伯爾尼公約規定的國際慣例多了20年,假如作品是集體創作或是1978年1月1日以前發表的,那麼其版權保持75至95年。1923年以前發表的作品均屬公有領域。但這個規則也有例外,一些1963年的作品已經進入公有領域,而另一些早於1923年的作品重新被申請版權因此依然受版權保護。出於法律的改變,到2019年為止不會有作品進入公有領域。(維基百科)
  中國版權法在作者死後五十年其作品即進入公有領域。以老舍為例,老舍死於1966年,因此2016年年底老舍的作品便到期,2017年1月1日即可出版。
  關於版權法,維基百科有足夠的記載,請自行閱讀。

哪些作者作品已經進入公有領域

  這一點,屬於情報收集,可以查看維基百科作者列表,或者百度百科相關作者介紹。這些百科通常已經很詳細的紀錄了已經去世作者的作品列表。
  維基百科作者列表,仍有不足之處。因此一個簡便的方法就是尋找民國初年出版的作品,譬如商務印書館的一些叢書。可以從其中的書名或作者進行深入調查,這些作品有多數都已經進入公有領域。從這裡出發,再利用維基百科、百度百科,即可找到更多的作品與作者。
  以目前個人所收集到的公版書而論,已經多到出不完的地步。因此,想要出版公版書,礦藏非常豐富。

需要留意的地方

  公版書有很多需要留意的地方,譬如:
  一、是否合著、合譯?如果是其進入公有領域的時限,是以最後去世作者加上版權規定的期限為標準。
  二、是否節譯?由於已經進入公有領域的書,多數翻譯作品都已經在漫長的五十年以上的歲月有了全譯本。因此,需考慮讀者能否接受的問題。
  三、是否真本?以台灣而言,早期有禁書問題,因此許多出版社為了出版一些作品,尤其是一些翻譯作品,便拿了一些大陸作者翻譯的作品來改,同時改了作者名稱,張冠李戴並不罕見。在當時這明顯是侵犯版權的做法,可是依照版權法規定,當原始作品進入公有領域之後,這種改動反而賦予改動者新的版權保護。因此,如果出版了這種假書,即便其中只有部分改動,也可能侵犯了「原盜版者」的「權益」!即便這很諷刺!
  四、承上,有些台灣早期出版品只是掛名出版,實則並非該作者(作品已經進入公有領域的作者)所創作。如果不能確認是否為該作者所做,就可能侵犯版權法,即便諷刺的是讀者可能根本不知道、無從知道原始作者是誰?
  五、有些進入公有領域的書已經被重新再版,因此,這種再版的印刷品質更高,更有利於OCR辨識。如果想要出版某書,最好能找到最新的版本,以節省時間與成本。

如何取得相關文本

  圖書館,古籍網,網路,是主要的管道。其中古籍網可以取得影印本或電子掃描檔。

如何將文本電子化

  兩種主要途徑,一是打字,二是將書籍掃描後以OCR軟體進行文字識別,轉成文字檔。以當前最優秀的OCR(辨識率最高)而論,是Google,可惜無法進行全書轉檔,只能一頁一頁轉,且辨識率雖然最高,卻顯然有很多不足之處。這一點,有興趣的讀者自行試驗即可知之。另外一套軟體是Abbyy,它對於文本的影像處理有很不錯的支持,可惜整體辨識率稍遜於Google。因此兩套OCR各有千秋。但若以辨識率而言,對於多數民國初期的文本,其效果都是很不理想的。因此,人工介入校稿,是無法省略的過程。

  待續。

沒有留言:

張貼留言