Yuichi MURATA
i0712****@coins*****
2007年 7月 22日 (日) 00:39:36 JST
はじめまして、村田と申します。 MeCab のオリジナル辞書を作ってみようということで、 手はじめに数件のニュース記事からコーパス、Seed 辞書を作成してみました。 ところが、この作成した辞書をつかって MeCab を動かしてみたところ 動作 672,名詞,サ変接続,*,*,*,*,動作,ドウサ,ドーサ 異常 203,名詞,形容動詞語幹,*,*,*,*,異常,イジョウ,イジョー 。 694,記号,句点,*,*,*,*,。,。,。 EOS というように、素性列の先頭に変な数値がついてきてしまっています。 また、辞書生成後の seed.csv を見て見ると、 単語によって変な数値が付加されているものと、そうでないものが見受けられます。 色々設定などを見返してみたのですが、どうにも何がいけないのか分かりません でした。 思い当たることなどあれば、ご教示いただけると助かります。