[mecab-users 111] Re: mecab-cost-trainのメモリ利用効率

アーカイブの一覧に戻る

NOKUBI Takatsugu knok****@daion*****
2006年 5月 23日 (火) 15:11:32 JST


At Sat, 20 May 2006 23:13:27 +0900,
NOKUBI Takatsugu wrote:
>   現状はコーパスを200分割して32bit環境で処理させています。金曜の午後に
> しかけたので、月曜日出社した時にどこまで進んでいるか確認します。

  今朝でやっと100を突破したところです。

  ところでいまごろ気づいたのですが、現在辞書はipadicと形式をあわせてい
るので、読みが素性の8番目にはいっています。品詞は1, 2番目にしか入って
いないので、わざわざeval-sizeを8にしなくとも、3番目に読みを入れて
eval-sizeを3にすればメモリの消費量を抑えられそうです。

  いったんそういう形で辞書をいじったあと、あとでipadicと同じ形式にcsv
を戻しても問題はないでしょうか。
-- 
野首 貴嗣
E-mail: knok****@daion*****
	knok****@namaz***** / knok****@debia*****




mecab-users メーリングリストの案内
アーカイブの一覧に戻る