どうして何年たってもIMEはバカなのか

2008-05-04 21:01 / scribbles

要するに、文章全体を変換するという無謀な目標を立てることから出発するからではないか。プロでもそうだが、多くのユーザは文節単位で変換しており、その誤変換に怒りを覚えているのだ。JustSystem や Microsoft は、シンプルな設計思想に戻るべきかと推察する。

ひとことだけボヤくコーナーを Twitter にしたので、短く突っ込む場所がなくなった。コンセプトとしては、山形(浩生)さんの『要するに』とか、呉智英さんの「折々のバカ」みたいな軽い突込みを意図しているのですが、まぁ記事として書いてもよかろうというわけで、これから短くポストすることにしました。なんか「記事」とか「エントリー」っていう呼称だと、リンクをつけなきゃとか変な気負いがあるのですが、ここはどうせ落書きの場所なので、おかしな自意識はやめようと思った次第です。

で、今回はIMEの誤変換という話なのですが、とにかくいつまで経っても誤変換が多い。しかも会社で使っている MS-IME は、いったん変換したあとでもう一度同じ語句を変換しても、さきほど確定した語句ではなく第二候補を先に出してくるというバカさ加減に辟易しています。そこで、冒頭にも述べたように、IME というか変換エンジンの設計あるいは設計目標を見直してはどうかと思うのです。

僕は19歳から28歳頃まで、父親の勤める会社から仕事をもらって、ワープロの入力を手伝うアルバイトをしていました。当時は富士通の OASYS というワープロ専用機の業務用マシンをなぜか自宅で使っていて、レーザープリンターとのセットで300万くらいしたのを覚えています。当時も『一太郎』はあったので、連文節や文章といった長い単位での変換は実装されていましたが、職業として入力しているオペレータの多くは文節変換を繰り返し行って、連文節や文章での変換はしていませんでした。理由は明白で、変換精度があまりにも低く、カーソルを誤変換の該当箇所に戻して部分的に変換をやり直すというカーソルの行きつ戻りつが、入力速度を大幅に落とすからです。そして、この実態は現在でもほぼ変わっていないばかりか、単純な文節の変換ですら精度は上がっていません。

もちろん、連文節変換でも文節変換でも、正しく変換しようとすると前後の文脈を解析しなければなりません。したがって、変換エンジンの精度を向上させるために単文節を単位として設計しても、それはすなわち連文節変換を単位とする設計と大きく異なりはしないでしょう。しかし、例えば「直前に確定した候補を次の変換では第一候補として出力する」といった単純なルールも守っていないようでは、変換エンジンとして何か設計がおかしいのではないかと思わずにはいられません。

この奇天烈な誤変換は、言うまでもなく MS-IME に著しく、ありていに言って 10 年前の富士通や JustSystem の変換エンジンよりも精度が低いと思われます。いや、どの IME についても言えることですが、ユーザの変換した履歴がうまく解析・蓄積されているとはとても思えないのです。もちろん、造語や辞書に載っていない語句は変換のしようもありませんが、辞書に登録されている語句であれば、いちど変換した語句を確定した統計がなんであれ、その文章ではその語句が使われる頻度が高いと見做して、それまでの履歴がどうあれ優先して変換候補にするのが自然と思うのですが、現行の変換エンジンはそのように設計されてはいないようです。

2 個のコメント

  1. ムカツキ小僧 says:

    長年しょうがなく使ってはいるものの、IMEのばかさ加減に頭にきて、思わず「IMEはバカ」とのキーワードをたたいてみたら、まさに同じ様な怒りの意見を拝見することができ、「あ~、自分だけじゃなかった・・・」と妙な満足感に浸っています。
    他にまともな変換エンジンはないものですかね~?

  2. philsci says:

    随分と前の落書きにコメントありがとうございます。
    この記事を書いた頃から一年は経っていますが、いまだに「変換しやすい日本語」を打てていない私です。

    会社で Fedora 10 に入っている IME も使っていますが、どうも事情はよく似ています。やはり、それなりにいちばんまともそうなのは、結局 ATOK ということになりそうなのですが・・・そんなわけで、いま自宅で使っているのは ATOK 16 です。2003年頃の発売でした。その頃から、テキスト解析もさんざんさせたり、じっと我慢して使ってはいますが、どうもエンジンのアップデート(つまりは買い替え)の方が有効なのかもしれません。

    こういう経緯で IME について述べているわけなので、JustSystem さんとは利害関係にありませんが、もし同じくらい昔のものをお使いなら、最近のエンジンを試してみるのもよいかと思います。PCショップのメーカー製にインストールされている場合もありますから、店頭で「いざ!」とばかりに日ごろから間違えている変換をお試しになるのもよいかと思う次第です。

    とは言え、何かひっかかるんですよね。単純に、「とても」の後には形容詞句が続くといったコローキャルを集めてゆくだけでも、組み合わせは無限にあってもパターンは無限にないのですし、どこかで「あとは微調整」というレベルに達する筈ではないかと思ってしまうのです。

コメントがあればどうぞ

monthly archives

yearly archives

archive

microformat (vCard)

KAWAMOTO Takayuki

Mr. KAWAMOTO Takayuki
also known as philsci
(birth day: Sep 20 1968)
live in Osaka city, Osaka, Japan.

promotions

accounts