ユーザー辞書変換ツールで日本語入力アプリの語彙力を強化

日本語入力アプリでは、ユーザー辞書に単語と読みを登録することで、内蔵の辞書に登録されていない語句も変換できるようになる。
辞書ファイルから一括して単語を登録するインポート機能を備えているアプリも多いが、「AIU-OpenWnn」など一部の日本語入力アプリでは、パソコン用の「MS-IME」などで出力した辞書ファイルを正常にインポートできないことがある。
一般的な辞書ファイルは「りゅうび 劉備 人名」のように読み、単語、種別の3要素の形式となっているが、アプリ側が読みと単語の2要素の辞書にしか対応しておらず、3要素目が2要素目の続きとして認識されてしまうのだ。

そこで、このような3要素の辞書ファイルを2要素の辞書ファイルに変換するツールをあんスマが作成した。ブラウザでファイルをアップロードするだけで、変換後の辞書ファイルをダウンロードできるぞ。

ついでに、Wikipediaの登場人物一覧などのURLを入力することで「名前(よみ)」のような部分を辞書として抽出する機能も用意した。いちいち自分で辞書を作成することなく、様々な用語を変換できるようになるぞ。



3要素形式の辞書ファイルを2要素形式に変換


001

MS-IMEやATOKなどパソコンのIMEからエクスポートした辞書ファイルは、このような「読み 単語 品詞」の3要素で構成されている。


002

「AIU-OpenWnn」など、2要素形式の辞書ファイルにしか対応していない日本語入力アプリにインポートすると、このように品詞の部分が単語の表記の一部として認識されてしまい、正しく登録されない。


003

このようなアプリに辞書をインポートしたければ、あんスマが用意した「ユーザー辞書変換」のページにアクセスしよう。なお、Android標準のブラウザなど一部のブラウザでは、変換した辞書のダウンロードが正常に行われないので、「Chrome」などのブラウザを利用しよう。


Chromeブラウザ-Google – Google Play の Android アプリ


010

「辞書ファイル」の欄でファイルの選択を行おう。Chromeなどでは、ファイルマネージャなどのファイル選択対応アプリが起動する。ブラウザとファイル選択アプリの組み合わせによっては、選択したファイルの受け渡しが正しく行われないことがあるようなので、上手く行かない場合は、他のファイルマネージャアプリを試してみよう。


004

「Convert」ボタンを押すと、ファイルがアップロードされ、変換結果の辞書ファイルがダウンロードされるぞ。


005

このように、品詞の部分が削除された辞書が生成される。なお、変換後の辞書は文字コードが「UTF-8」に変換されるので、文字コードの手動指定が必要なアプリでは注意しよう。


006

これで正しく辞書をインポートできたぞ。


Wikipediaの人物一覧から辞書を生成


007

Wikipediaの漫画やアニメのページでは、登場人物の一覧の名前の横に読み仮名が振られている。


008

「ユーザー辞書変換」のページで、「WikipediaのURL」の欄に、読み仮名付きの名前が列挙されたWikipedia記事のURLを貼り付け、右の「Convert」を押そう。


009

このような辞書ファイルがダウンロードされ、手軽に登場人物名を単語登録できるぞ。

関連記事

2014年05月01日11時04分 公開 | カテゴリー: 文書編集 | キーワード:, | Short URL
このエントリーをはてなブックマークに追加

最新記事