フォーラム: 【移行しました】サポート (スレッド #36630)

jpegのようなファイルをファイル名で検索したいが、ファイルの中身をインデックスに追加したくない (2015-03-24 12:04 by ogasahara #75806)

お世話になっております。fess-9.3.3を使用しております。

現在fessを使用して共有フォルダの検索サーバーを作成していますが、対象にjpegファイルが多く、jpegファイルの中身がsolrのインデックスサイズを肥大化させてしまっています。
jpegファイルを検索対象から外せば肥大化は防げると思いますが、ファイル名だけは検索したいという状況です。

jpegのような「ファイルの中身に意味がないファイル」を、ファイル名のみインデックスに追加し、ファイルの中身は追加しないように設定したいのですが、設定だけで可能でしょうか?

メッセージ #75806 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: jpegのようなファイルをファイル名で検索したいが、ファイルの中身をインデックスに追加したくない (2015-03-31 10:25 by shinsuke #75855)

現状、そこを制御することはできないので、
次のバージョンで対応したいと思います。
#75806 への返信

メッセージ #75855 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: jpegのようなファイルをファイル名で検索したいが、ファイルの中身をインデックスに追加したくない (2015-03-31 10:53 by shinsuke #75856)

[メッセージ #75855 への返信]
> 現状、そこを制御することはできないので、
> 次のバージョンで対応したいと思います。

現状でも対応方法がありました。

https://raw.githubusercontent.com/codelibs/s2robot/s2robot-0.8.x/s2robot/src/main/resources/s2robot_extractor.dicon
をwebapps/fess/WEB-INF/classesに置いて、
<component name="tikaExtractor" class="org.codelibs.robot.extractor.impl.TikaExtractor">
<property name="readAsTextIfFailed">false</property>
のようにreadAsTextIfFailedをfalseで置くことで、
含まれないようになると思います。
#75855 への返信

メッセージ #75856 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする