« Internet Explorer 8 入れてみた | トップページ | 活用の行は重要ではない »

2009年3月22日 (日)

IME の文法体系はできるだけ単純に

「かは 變(は) ラ行四段」や「かへ 變へ 一段」なんかは、辭書には「か 變 ハ行下二段」で登録し、そこから何とかして「かは 變(は) ラ行四段」に相當する變換候補を動的に生成できないものかと考へてゐる。

それはやめた方がいいと思う。

そういうことをやりだすと、この場合はこう、あの場合はこう、とやりたいことがどんどん増えていって、IME の文法規則がどんどん複雑になっていってしまい、いつまでたってもプログラムが実装できないということになりかねない。どうせ文法なんてものは既存の言語の体系を説明するために後付けで考え出したもので、例外規則があちこちにある。あまり細かい事例にまで文法で対応しようとしてはいけないと思う。

個人的には、名詞にするを付けることで一つのサ変動詞になることすら辞書に覚えさせる必要はないと思っている。IME はするというサ変動詞一つの存在だけを理解しておけば、入力するのような一般的に一つの動詞とみなされるものも、入力という名詞とするという動詞がつながったものとして処理できる。あとは、入力のあとにするとかしたとかが来やすいということをコーパスが知っていればよい、と。

せめて「辭書のソース」には最小限の情報を載せるやうにして、そこから實際に使用する辭書(=活用の變化を別個の「語」として持つ辭書とか)を「コンパイル」するやうにしたいところ。

これも IME の文法が複雑になる代わりに複雑なコンパイラを用意しなければいけなくなるだけで、複雑なプログラムを実装しなければいけないという点では同じ。簡単な辞書のソースから冗長な辞書を生成するくらいなら、最初から冗長な辞書を作った方がいい。

|

« Internet Explorer 8 入れてみた | トップページ | 活用の行は重要ではない »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/169172/44423855

この記事へのトラックバック一覧です: IME の文法体系はできるだけ単純に:

« Internet Explorer 8 入れてみた | トップページ | 活用の行は重要ではない »