最終更新日: 2008年07月20日

どうして何年たってもIMEはバカなのか

2008年05月04日 21:01

要するに、文章全体を変換するという無謀な目標を立てることから出発するからではないか。プロでもそうだが、多くのユーザは文節単位で変換しており、その誤変換に怒りを覚えているのだ。JustSystem や Microsoft は、シンプルな設計思想に戻るべきかと推察する。

ひとことだけボヤくコーナーを Twitter にしたので、短く突っ込む場所がなくなった。コンセプトとしては、山形(浩生)さんの『要するに』とか、呉智英さんの「折々のバカ」みたいな軽い突込みを意図しているのですが、まぁ記事として書いてもよかろうというわけで、これから短くポストすることにしました。なんか「記事」とか「エントリー」っていう呼称だと、リンクをつけなきゃとか変な気負いがあるのですが、ここはどうせ落書きの場所なので、おかしな自意識はやめようと思った次第です。

で、今回はIMEの誤変換という話なのですが、とにかくいつまで経っても誤変換が多い。しかも会社で使っている MS-IME は、いったん変換したあとでもう一度同じ語句を変換しても、さきほど確定した語句ではなく第二候補を先に出してくるというバカさ加減に辟易しています。そこで、冒頭にも述べたように、IME というか変換エンジンの設計あるいは設計目標を見直してはどうかと思うのです。

僕は19歳から28歳頃まで、父親の勤める会社から仕事をもらって、ワープロの入力を手伝うアルバイトをしていました。当時は富士通の OASYS というワープロ専用機の業務用マシンをなぜか自宅で使っていて、レーザープリンターとのセットで300万くらいしたのを覚えています。当時も『一太郎』はあったので、連文節や文章といった長い単位での変換は実装されていましたが、職業として入力しているオペレータの多くは文節変換を繰り返し行って、連文節や文章での変換はしていませんでした。理由は明白で、変換精度があまりにも低く、カーソルを誤変換の該当箇所に戻して部分的に変換をやり直すというカーソルの行きつ戻りつが、入力速度を大幅に落とすからです。そして、この実態は現在でもほぼ変わっていないばかりか、単純な文節の変換ですら精度は上がっていません。

もちろん、連文節変換でも文節変換でも、正しく変換しようとすると前後の文脈を解析しなければなりません。したがって、変換エンジンの精度を向上させるために単文節を単位として設計しても、それはすなわち連文節変換を単位とする設計と大きく異なりはしないでしょう。しかし、例えば「直前に確定した候補を次の変換では第一候補として出力する」といった単純なルールも守っていないようでは、変換エンジンとして何か設計がおかしいのではないかと思わずにはいられません。

この奇天烈な誤変換は、言うまでもなく MS-IME に著しく、ありていに言って 10 年前の富士通や JustSystem の変換エンジンよりも精度が低いと思われます。いや、どの IME についても言えることですが、ユーザの変換した履歴がうまく解析・蓄積されているとはとても思えないのです。もちろん、造語や辞書に載っていない語句は変換のしようもありませんが、辞書に登録されている語句であれば、いちど変換した語句を確定した統計がなんであれ、その文章ではその語句が使われる頻度が高いと見做して、それまでの履歴がどうあれ優先して変換候補にするのが自然と思うのですが、現行の変換エンジンはそのように設計されてはいないようです。

コメントがあればご記入ください。

  

  

  

archive / 過去の記事

Buzztracker daily image
image produced by buzztracker.org.