コンテンツフィルタでインターネットのゴミ情報を水際で食い止める

 ブログ界隈では毎日のようにWebサイトのデザインに関する不平を聞く。大げさなテキストを好まない人もいれば、バナー表示や広告を嫌う人もいる。私が苛立ちを覚えるのは、ポップアップや無用のJavaScriptおよびクッキーだ。こうしたゴミ情報を取り除けば、不要なデータのダウンロードによる帯域幅の無駄使いがなくなるので、インターネットの接続速度を上げることができる。本稿では、Webサイトから取得するコンテンツのフィルタリングに使えるツールをいくつか紹介する。

Privoxy

 Privoxyは興味深い機能を満載したスタンドアロンのアプリケーションだ。インストールはきわめて簡単で、デフォルトの設定は大半のユーザにとって申し分ないものになっている。インストールを行うコマンドは、Fedoraユーザなら「yum install privoxy」、Ubuntuユーザなら「sudo apt-get install privoxy」となる。あるいは、ソースtarballを取得して「./configure」、「make」、「make install」の各コマンドでインストールしてもよい。インストールが済むと、Privoxyはローカルホスト(127.0.0.1)のポート8118番にバインドされる。別のポートとネットワークインタフェースがよければ、ソースからのインストール中に選択するか、「/etc/privoxy/config」ファイルのセクション4.1で指定することができる。

 使い始める前に、ブラウザにPrivoxyの情報を設定する必要がある。Firefoxであれば、「オプション」ダイアログボックスの「詳細」、「ネットワーク」タブ、「接続設定」ボタンを順にクリックする。「手動でプロキシを設定する」を選択して、「HTTPプロキシ」の欄に「127.0.0.1 」と入力してポートを「8118」とする。また、「直接接続するサイト」の欄からは「localhost」も「127.0.0.1」も削除しておくこと。これで、ブラウザから「http://p.p/」にアクセスすればPrivoxyのインタフェースが表示される。

 Privoxyには2種類の設定ファイルが用意されている。その1つ、フィルタファイルでは、HTML、CSS、JavaScriptをはじめとするコンテンツのフィルタリングが行える。デフォルトのフィルタルールは、「/etc/privoxy/default.filter」ファイルに定義されている。アクションファイルと呼ばれるもう1つのファイルは、特定のWebサイトに対してPrivoxyが取るべき対処を定義するものだ。アクションファイルに定義されるルールは、クッキーや広告、その他のオブジェクトを対象としている。デフォルトの設定では、一定のサイズを超えるバナー広告、すべてのポップアップウィンドウ、Googleの広告が抑制されるようになっている。こうしたデフォルトのアクションルールは、「/etc/privoxy/default.action」ファイルに定義されている。すべての設定ファイルで正規表現が利用されているため、その辺りがよくわからない人は「default.filter」と「default.action」のどちらのファイルも編集しないほうがよいだろう。また残念ながら、ブラウザのインタフェースから設定ファイルを編集することはできない。