OHTAKE Kiyonori
otake****@fw*****
2006年 8月 11日 (金) 12:18:40 JST
大竹です。 申し訳ありません。 以下のメールで使用したmecabは version 0.92 でした。 0.93 では、このようになりませんでした。 From: OHTAKE Kiyonori <otake****@fw*****> Subject: [mecab-users 157] Re: ユーザ辞書利用におけるエラーについて Date: Fri, 11 Aug 2006 10:07:12 +0900 (JST) > From: yamada hiroyuki <yamahiroyu_y****@yahoo*****> > Subject: [mecab-users 156] ユーザ辞書利用におけるエラーについて > Date: Thu, 10 Aug 2006 23:24:21 +0900 (JST) > > > いつもmecabを使わせてもらっております。 > > 現在、0.93を使っているのですが、ユーザー辞書を使って、形 > > 態素解析をすると > > プログラムエラーになります。 > > (example 以下のテストプログラムを使いました。) > mecab-dict-info して気がついた点だけなんですが... > > charsetは euc-jp でしょうか。 > mecab-dict-index に渡すパラメータのうち、 > システムの辞書の charset とユーザ辞書の charset が合っていないと > ご報告されたエラーが表示されました。 > > たとえば、私が自分で構築したシステム辞書は > charset が EUC-JP だったのですが、 > マニュアルにある通り、 > /usr/local/libexec/mecab/mecab-dict-index \ > -d/usr/local/lib/mecab/dic/ipadic \ > -u foo.dic -f euc-jp -t euc-jp foo.csv > のようなユーザ辞書をつくると問題が再現されました。 > これを > /usr/local/libexec/mecab/mecab-dict-index \ > -d/usr/local/lib/mecab/dic/ipadic \ > -u foo.dic -f EUC-JP -t EUC-JP foo.csv > にすると、ユーザ辞書を利用して解析することができました。 > > 参考になれば。 > ---- > 大竹清敬(おおたけ きよのり) otake [at] fw.ipsj.or.jp ---- 大竹清敬(おおたけ きよのり) otake [at] fw.ipsj.or.jp