[mecab-users 286] 作成したオリジナル辞書の素性列に変な数値がでてしまいます。

アーカイブの一覧に戻る

Yuichi MURATA i0712****@coins*****
2007年 7月 22日 (日) 00:39:36 JST


はじめまして、村田と申します。

MeCab のオリジナル辞書を作ってみようということで、
手はじめに数件のニュース記事からコーパス、Seed 辞書を作成してみました。

ところが、この作成した辞書をつかって MeCab を動かしてみたところ


動作    672,名詞,サ変接続,*,*,*,*,動作,ドウサ,ドーサ
異常    203,名詞,形容動詞語幹,*,*,*,*,異常,イジョウ,イジョー
。      694,記号,句点,*,*,*,*,。,。,。
EOS


というように、素性列の先頭に変な数値がついてきてしまっています。
また、辞書生成後の seed.csv を見て見ると、
単語によって変な数値が付加されているものと、そうでないものが見受けられます。

色々設定などを見返してみたのですが、どうにも何がいけないのか分かりません
でした。
思い当たることなどあれば、ご教示いただけると助かります。




mecab-users メーリングリストの案内
アーカイブの一覧に戻る