[mecab-users 157] Re: ユーザ辞書利用におけるエラーについて

アーカイブの一覧に戻る

OHTAKE Kiyonori otake****@fw*****
2006年 8月 11日 (金) 10:07:12 JST


大竹です。

From: yamada hiroyuki <yamahiroyu_y****@yahoo*****>
Subject: [mecab-users 156] ユーザ辞書利用におけるエラーについて
Date: Thu, 10 Aug 2006 23:24:21 +0900 (JST)

> いつもmecabを使わせてもらっております。
> 現在、0.93を使っているのですが、ユーザー辞書を使って、形
> 態素解析をすると
> プログラムエラーになります。
> (example 以下のテストプログラムを使いました。)
mecab-dict-info して気がついた点だけなんですが...

charsetは euc-jp でしょうか。
mecab-dict-index に渡すパラメータのうち、
システムの辞書の charset とユーザ辞書の charset が合っていないと
ご報告されたエラーが表示されました。

たとえば、私が自分で構築したシステム辞書は
charset が EUC-JP だったのですが、
マニュアルにある通り、
/usr/local/libexec/mecab/mecab-dict-index \
  -d/usr/local/lib/mecab/dic/ipadic \
  -u foo.dic -f euc-jp -t euc-jp foo.csv
のようなユーザ辞書をつくると問題が再現されました。
これを
/usr/local/libexec/mecab/mecab-dict-index \
  -d/usr/local/lib/mecab/dic/ipadic \
  -u foo.dic -f EUC-JP -t EUC-JP foo.csv
にすると、ユーザ辞書を利用して解析することができました。

参考になれば。
----
大竹清敬(おおたけ きよのり) otake [at] fw.ipsj.or.jp



mecab-users メーリングリストの案内
アーカイブの一覧に戻る