IME の文法体系はできるだけ単純に
「かは 變(は) ラ行四段」や「かへ 變へ 一段」なんかは、辭書には「か 變 ハ行下二段」で登録し、そこから何とかして「かは 變(は) ラ行四段」に相當する變換候補を動的に生成できないものかと考へてゐる。
それはやめた方がいいと思う。
そういうことをやりだすと、この場合はこう、あの場合はこう、とやりたいことがどんどん増えていって、IME の文法規則がどんどん複雑になっていってしまい、いつまでたってもプログラムが実装できないということになりかねない。どうせ文法なんてものは既存の言語の体系を説明するために後付けで考え出したもので、例外規則があちこちにある。あまり細かい事例にまで文法で対応しようとしてはいけないと思う。
個人的には、名詞にする
を付けることで一つのサ変動詞になることすら辞書に覚えさせる必要はないと思っている。IME はする
というサ変動詞一つの存在だけを理解しておけば、入力する
のような一般的に一つの動詞とみなされるものも、入力
という名詞とする
という動詞がつながったものとして処理できる。あとは、入力
のあとにする
とかした
とかが来やすいということをコーパスが知っていればよい、と。
せめて「辭書のソース」には最小限の情報を載せるやうにして、そこから實際に使用する辭書(=活用の變化を別個の「語」として持つ辭書とか)を「コンパイル」するやうにしたいところ。
これも IME の文法が複雑になる代わりに複雑なコンパイラを用意しなければいけなくなるだけで、複雑なプログラムを実装しなければいけないという点では同じ。簡単な辞書のソースから冗長な辞書を生成するくらいなら、最初から冗長な辞書を作った方がいい。
| 固定リンク

コメント