2014年10月21日 星期二

谷歌注音輸入法最新統計數據

  我曾將超自然輸入法(或預測型輸入法)的發展分為三個階段(層次),第一階段是充分利用統計技術,第二階段充分利用語法知識,第三階段充分利用語義理解技術。以前幾天發佈的蘋果原生輸入法看來,它對於第一階段的利用已經開發得快到底了,因此,第三方中文輸入法基本已經可以宣告沒戲了。其中的主因在於當前的其他中文輸入法,一來在統計上利用不足,二來對於語法知識的掌握不夠,三來完全沒有所謂的語意理解技術。所以只有當第三方輸入法能邁入第二層次時,開發蘋果第三方中文輸入法才有意義。但即使如此,由於蘋果當前的取碼數「在最理想狀態下(由於前一篇以及以下各篇的統計數據都排除了注音、拼音首字輸入的試錯按鍵數,因此數據看起來非常好。但如果包含這部份的按鍵數,則每一家的平均取碼數都至少要再拉高取碼數0.1-0.5左右)」已經1.4左右。因此,一般使用者不可能察覺那些取碼數在1.4以上或左右徘徊的輸入法的好處。所以,如果有人說中文第三方輸入法將在蘋果系統形成百家爭鳴的態勢,個人覺得那是天方夜譚。確實,可以有很多人繼續投入開發,但鐵定沒戲。尤其當使用者懂得用客觀的數據而非主觀的感受來衡量一個輸入法的好處時。
  自然,如果以超自然輸入法已經完成(包含設計思想)的部份,那麼蘋果原生中文輸入法即便是在第一階段也還有不少可以改進的地方,這些地方都改進後,即便尚未使用第二階段的技術,也足以將取碼數再降零點幾個百分點。這部份的「細節」或「技術」(目前寫於拙作《中文資訊處理》〈輸入法〉一章之中),等超自然輸入法正式發表後,再來談談。
  以下是對谷歌注音輸入法的最新測試,同樣採用首字輸入混合輸入,並取最好的結果加以記錄(因此事實上沒有人可以剛好第一次就全打出最好的結果)。統計結果可能隨著使用者的個人使用習慣而略有改變。統計樣本雖然小了一點,但還有些參考價值。畢竟人力與時間不足,因此只能用這樣小的樣本來加以統計,這一點請見諒。從這次的統計結果看來,谷歌的進步比較少,或者可能其實沒有更新(不太可能),但不管如何,以這次試驗的結果看來,蘋果幾乎完勝了谷歌。
  這一次挑選的句子,其實是很普通的句子,同時也沒有牽涉到人名、地名等。事實上,輸入法本身還得具備人名、地名識別等功能,所謂的「學習」功能才算達標。這一點,也等超自然輸入法推出後再來詳論。
  統計數據請見以下表格:
原句 長度 按鍵數 比率
你還好嗎 4 5 1.25
記得把東西放到冰箱 9 11 1.222222
要約幾點 4 12 3
我跟別人有約了 7 13 1.857143
今天想去哪吃 6 11 1.833333
我今天早上沒吃早餐 9 13 1.444444
什麼時候回家 6 8 1.333333
最近還好嗎 5 10 2
可以幫我一件事嗎 8 16 2
東西我已經發過去了 9 14 1.555556
你查收一下 5 10 2
在嗎 2 4 2
請儘快回覆 5 6 1.2
老闆通知週末加班 8 14 1.75
什麼時候是最後期限 9 12 1.333333
去樓下等我 5 10 2
五分鐘後 4 5 1.25
記得給我帶東西 7 14 2
我會晚點到 5 12 2.4
現在比較忙 5 7 1.4
怎麼可能 4 5 1.25
我會處理好 5 7 1.4
讓別人代替我先去一下 10 18 1.8
不可能的吧 5 7 1.4
快告訴我 4 6 1.5
你在哪裡 4 5 1.25
我在等你 4 5 1.25
週末小聚一下如何 8 14 1.75
有事請教你 5 8 1.6
還有其他的嗎 6 7 1.166667
還要等幾天 5 11 2.2
你看了嗎 4 7 1.75
回去再說吧 5 6 1.2
沒人知道的 5 7 1.4
就這樣吧 4 6 1.5
待會見 3 11 3.666667
你說這樣就這樣 7 8 1.142857
等我再檢查一次 7 12 1.714286
沒問題 3 3 1
等一下 3 5 1.666667
我還沒出發 5 8 1.6
東西還滿意嗎 6 7 1.166667
你有沒有想我 6 8 1.333333
  240 388 1.616667

2014年10月20日 星期一

蘋果輸入法最新測試


  




由於距離去年發表「超自然輸入法」的原型測試影片以來,已經接近一年了。因此,這一年來幾乎所有大企業(智能手機)的輸入法都應該獲得大幅度的改進。有鑑於此,為了體現最新的輸入法發展「局勢」,因此,筆者重新挑選了43句對各家輸入法進行測試。這一次,我們首先測試蘋果輸入法。測試的規則如下:
  一、輸入注音或拼音的音符,每一次計一。
  二、選擇輸入法選單欄位,每按一次計一。
  三、打開下拉式選單或滑動一次選單(蘋果選單可滑動),每滑一次計一。

  iOS 8 發佈後,蘋果中文輸入法有了飛躍式的增長。第一個改進,其中一如幾個月前的預測,在使用者尚未輸入任何字元時(或使用者按下斷行號,或按下標點後),蘋果已經有了預設選單!切莫小看這樣一個簡單到極點的改進,以之前超自然85%的預測選單的準確率來計算,假設有一億人「每天」選擇了這個預設選單兩三次,那節省下來的時間與能源,已經非常「可觀」!第二個改進,之前打「幾點下課」,假設「課」打錯了或選錯了,刪除了那個字元後,選單並不會自動再出現「課」(此時字幕上是「幾點下」,選單應該包含「課、班」等。),現在已經可以了。這表示,蘋果已經加入了中文分詞的技術(超自然一開始就加入了)。第三個改進,自動學習功能,以圖片中的例句(見截圖):「你說這樣就這樣」,當電腦學習後,下次再打,幾乎可以「從頭選到尾」:「你(句首預測預設選單)說(預測選單)這樣(預測選單)就(預測選單)這樣(預測選單)」。第四個改進,繁體中文注音輸入法增加了「首字輸入」選項。(簡體拼音系統老早就具備首字輸入了)
  其他比較次要的改進,就不多說。結論是,蘋果的原生輸入法藉由這些改進,使得整體效率大幅提昇,取碼數從2.3降低到1.4左右。基本上已經逼近了之前筆者說過的1.3門檻。也就是說,第三方輸入法(中文)幾乎無法在iOS的環境下存活了!因此奉勸有志於開發第三方輸入法的開發者可以放棄了蘋果了。因為,基本上不可能有賣點的。
  至於超自然輸入法,自然早就料想到今日的局面。只是從去年的幕資計畫上那冷清的反應看來,大概都能料到,真正高超的技術要在台灣獲得青睞,並不容易。而以上蘋果的改進,也都是一如預期的!(超自然第一版自然比這還先進一點)所以,當使用者認為蘋果輸入法好用時,切莫忘記,這樣好用的輸入法,原本是可以「土生土長」的。
  蘋果原生輸入法統計數據如下:
原句 長度 按鍵數 比率
你還好嗎 4 6 1.5
記得把東西放到冰箱 9 10 1.111111
要約幾點 4 12 3
我跟別人有約了 7 10 1.428571
今天想去哪吃 6 11 1.833333
我今天早上沒吃早餐 9 12 1.333333
什麼時候回家 6 7 1.166667
最近還好嗎 5 7 1.4
可以幫我一件事嗎 8 15 1.875
東西我已經發過去了 9 13 1.444444
你查收一下 5 9 1.8
在嗎 2 4 2
請儘快回覆 5 6 1.2
老闆通知週末加班 8 9 1.125
什麼時候是最後期限 9 16 1.777778
去樓下等我 5 8 1.6
五分鐘後 4 9 2.25
記得給我帶東西 7 10 1.428571
我會晚點到 5 8 1.6
現在比較忙 5 6 1.2
怎麼可能 4 5 1.25
我會處理好 5 6 1.2
讓別人代替我先去一下 10 11 1.1
不可能的吧 5 6 1.2
快告訴我 4 5 1.25
你在哪裡 4 5 1.25
我在等你 4 5 1.25
週末小聚一下如何 8 10 1.25
有事請教你 5 12 2.4
還有其他的嗎 6 8 1.333333
還要等幾天 5 8 1.6
你看了嗎 4 6 1.5
回去再說吧 5 7 1.4
沒人知道的 5 6 1.2
就這樣吧 4 6 1.5
待會見 3 6 2
你說這樣就這樣 7 9 1.285714
等我再檢查一次 7 11 1.571429
沒問題 3 4 1.333333
等一下 3 4 1.333333
我還沒出發 5 8 1.6
東西還滿意嗎 6 7 1.166667
你有沒有想我 6 7 1.166667
  240 350 1.458333