流行ネタからブッ飛んだ予測変換まで 日本語入力ソフトの知られざる性能を徹底比較する

スマホの日本語入力(IME)アプリのベストはどれか、というのはなかなか結論の出ない問題だ。
スマホ標準のIMEは論外としても、「Google日本語入力」「ATOK」「Simeji」の3つにはそれぞれ熱狂的なファンが付いていて、どのアプリが最強のIMEであるかを巡って普段から論争が繰り広げられている。Googleのデータベースを背景に豊富な単語辞書を持つGoogle日本語入力、長年PCの世界で蓄積した高い変換精度が武器のATOK、中国の検索サービス「百度」の傘下で顔文字などの表現に強さを発揮するSimejiと、それぞれ他にない強みを持っているので、そう簡単に甲乙は付けがたい。
これらのIME界の3強アプリを使って、さまざまな条件で変換を行い結果を比較、最も優れたIMEはどれか対決させてみたぞ。


【対決1】「あんどろいどすまーと」を英語のスペルに変換できるのは?

カタカナ英語をアルファベットに変換するIMEの機能は、英語のスペルに自信がないときにとても便利。例えば「Android」のスペルに自信がないとき「アンドロイド」と入力すれば、変換候補から正しい英語に変換できる。今回取り上げたIMEはいずれもアルファベットへの変換に対応している。が、個別の単語は変換できても、2つの単語が続いた造語を変換するとなると話は別。「あんどろいどすまーと」を英語のスペルに変換できるかどうか、試してみたぞ。
最も優秀だったのはATOK。「あんどろいど」と「すまーと」を別個の単語として認識し、それぞれで英語の変換候補を表示した。次点がSimejiで、「あんどろいど」は英語変換できたものの、後半の「すまーと」部分はできず。標準のIMEとGoogle日本語入力では、英単語として認識されていないのか、変換候補に英語は一切なしという結果に終わっている。

スマホ標準のIMEGoogle日本語入力
ansma_defo
スマホ標準のIMEでは、ひらがな・カタカナへの変換のみが行われ、英語への変換は行われない。最初から付いてる機能なので多くを求めるのは酷というもの。
ansma_google
「アンドロイドスマートフォン」などの予測変換は行われているが、英語への変換は行われず。無駄に漢字に変換してみたりと、明らかにマッチングが上手く行っていない
ATOKSimeji
ansma_atok
「変換」をタップすると「Andorid」に変換、続けてタップすると「Smart」を変換。単語の切り分けには無類の強さを発揮するATOKの本領発揮
ansma_simeji
「Android」は英語に変換できたものの、「すまーと」は変換できず。個別の単語は英語に変換できるのに、なぜ一緒だとできないのか……

【対決2】「ももクロ」は登録済み?流行キーワードの予測変換で対決

最新のキーワードを正しく変換してくれるかどうかは、IMEを評価する上での重要なポイントとなる。今回は、世間では微妙に知られつつある存在として、「ももいろクローバーZ」の頭の部分「ももいろ」を入力して、予測変換にグループ名が表示されるかを調べてみた。
ウェブのデータを参照して変換候補に反映しているGoogle日本語入力は、「ももいろクローバーZ」を正しく表示。また、最新の流行語がいち早く辞書登録されることで知られるATOKも、少ない変換候補の中にグループ名を正確に表示している。反対に、全く変換候補に上がらなかったのがSimeji。単語辞書は優秀なはずなのだが、登録されている単語のジャンルが偏っているのだろうか?

スマホ標準のIMEGoogle日本語入力
momo_defo
旧グループ名である「ももいろクローバー」までは変換できている。あとは単語辞書が最新版にアップデートされれば、「Z」が追加されて正しく変換できるようになるはず
momo_google
「ももいろクローバーZ」。完璧。ただし「ももいろ」絡みでほとんど需要のなさそうな単語まで表示する。予測変換に「桃色大戦ぱいろん」が含まれていて個人的にはうれしい
ATOKSimeji
momo_atok
「ももいろクローバーZ」という単語は最初からきっちり辞書登録済み。そのほかの余計な変換候補は一切表示しないという、実にATOKらしい結果となった
momo_simeji
変換候補にグループ名自体が表示されず。なぜか中国語の「桃色餅乾」が含まれているが、Simejiのサービス提供元が中国の検索サービスであることの影響だろうか……?

【対決3】メールに使える顔文字がたくさん入っているIMEを探せ

いまどきのメールは文中に顔文字を入れるのが当たり前。ほとんどのIMEは最初から単語辞書に顔文字が含まれていて、「顔文字」と入力するだけで候補を呼び出せる。ただし、ひとくちに顔文字といっても、IMEによって種類がだいぶ違うのに注意。例えば、Google日本語入力の顔文字は2ちゃんねるで使われるものが多く、Simejiの顔文字は、ブログやTwitterで使われているものが中心。なお、ATOKの場合、単語辞書には顔文字が一切含まれていない。辞書のクオリティにこだわり余計な要素を排除する、ATOKらしい戦略だ。

スマホ標準のIMEGoogle日本語入力
kao_defo
携帯電話の頃からメールでよく使われている定番の顔文字が登録されている。メールで顔文字を使うならここから選ぶのが無難な選択。ただし、バリエーションは少ない
kao_google
顔文字の種類は豊富だが、2ch発の顔文字がかなり含まれているのに注意。2chのキャラの顔文字はメールではまず使われない。2ちゃんねらーであると喧伝したい場合以外は自重すべし
ATOKSimeji
kao_atok
Atokの単語辞書には顔文字が含まれていないため、「顔文字」と入力しても寂しい結果に。こういったお遊びの機能は入れないのがATOK。使いたければ自分で顔文字辞書を探して登録すべし
kao_simeji
膨大な量の顔文字が登録されているSimeji。めったに見かけないようなレアな顔文字も多数含まれている。ブログやSNSで使われている顔文字が多いので、メールで使ってもそれほど違和感はない

【対決4】「おつかれ」の一言を普段の会話のように自然に補完する

IMEの変換候補では、単語の一部を補うだけではなく、文章全体を補完してくれることもある。例えば、「おつかれ」と入力すると、「お疲れさま」「お疲れちゃん」が変換候補に表示されるといった具合。4つのIMEで「おつかれ」の変換候補にどのような表現が出てくるのかを比較してみたぞ。
Google日本語検索では、「お疲れさまです」から「お疲れちゃん」まで、考えうる表現のバリエーションをほぼすべて表示。とはいえ、「お憑かれ」といった明らかな誤用も含まれているのが気になるところ。ATOKの場合は、「お疲れちゃん」といった砕けた表現はなく「お疲れさま」「お疲れさん」くらいの堅実な表現に留められている。
そして、凄いことになっているのがSimeji。顔文字が含まれていたり、人名が入っていたり。「おつかれサマンサタバサ」「おちゅっちゅー☆」など、一体どこの世界で使われているのかと問いただしたくなるような変換候補が続々。メールで日頃こういう表現を使っているには便利なのかもしれないが……。

スマホ標準のIMEGoogle日本語入力
otsu_defo
「おつかれ」を単純に変換した候補に加えて、登録されている絵文字が表示される。言い回しを補完するようなことはしないが、最低限の役割は果たしている
otsu_google
「おつかれ」から派生する大量の言い回しが表示される。入力を補完できるので便利だが、「尾疲れ」など絶対に使わないような変換候補が出てくるあたりGoogleらしい
ATOKSimeji
otsu_atok
「お疲れ様」「お疲れさま」など、そのまま使える実用的な表現だけが変換候補に表示されるATOK。こういった日本語の言い回しの精度に関しては他の追随を許さない
otsu_simeji
最初の変換候補は普通だが、後半になるにつれてぶっ飛んだ表現に。顔文字が加わるのはいいとしても、「おつかれ」を「おちゅっちゃー☆」と変換するのはいかがなものか

【対決5】「もう死にたい…」思わず吐露した弱音を変換できるのは?

世の中楽しいことばかりではない、ときには誰かに「もう死にたい」と愚痴りたくなることもあるだろう。しかし、IMEによっては、そう簡単に入力させてはくれない。ATOKで「しにたい」を入力すると、変換精度に優れたはずのATOKが、「詩に対する」「死に対して」など、まるで話をそらすかのように無関係な変換候補ばかり表示。一番自然な変換であるはずの「死にたい」はリストの一番最後なのだ。
そして、日本語入力ソフトの範疇を完全に超えてしまっているのがSimeji。「しにたい」を入力すると、なぜかそれに対するメッセージが変換候補に出てくる。「そんなこと簡単に言うもんじゃない」と諭すものから「死ねばいいじゃん」「一緒に逝こう」と背中を押すものまで。IMEに励まされて、生きる決意を新たにした人がいるのであれば結構なことだが……?

スマホ標準のIMEGoogle日本語入力
sini_defo
標準のIMEでは「しにたい」を「死にたい」とそのまま素直に変換候補に表示する。これが日本語入力ソフトの本来あるべき姿
sini_google
「死にたい」に続いて、どう考えても使われない変換候補が大量に出てくる。死のうが生ようが知ったこっちゃない実にGoogleらしい変換候補
ATOKSimeji
sini_atok
「しにたい」と入力したはずなのに、最初に出てくるのは「詩に対する」という誤魔化しているとしか思えない変換候補。「しにたい」の変換は「死にたい」以外にありえないだろ!
sini_simeji
「しにたい」を漢字に変換するつもりが、なぜか励まされたり死ねと言われたり。日本語入力ソフトの変換機能としてはまったく論外だが、別の意味で必要な変換候補なのかもしれない

関連記事

2012年09月26日05時14分 公開 | カテゴリー: 文書編集 | キーワード: | Short URL
このエントリーをはてなブックマークに追加

最新記事