PDF編集を可能にするOpenOffice.orgエクステンション

 OpenOffice.orgに簡単なPDF編集機能を追加する取り組みが進められている。ただし、一般に使えるようになるのは数か月先だろう。少し前にOpenOffice.org Extensionsサイトで公開された Sun PDF Import (SPI)はまだベータ版であり、OpenOffice.org 3.0(9月にリリース予定)の最近の開発者向けビルドでしか動作しない。最終リリース版の出来は今のところ誰にもわからないが、このベータ版の機能は現在手に入るPDFインポートツールのなかではちょうど中間レベルにあたる。

 SPIを試すには、まずOpenOffice.org 3.0のスナップショットビルドをダウンロードしてインストールする必要がある。その後、このビルドの「ツール」→「拡張機能マネージャ」からSPIをインストールすればよい。SPIをインストールしたOpenOffice.org 3.0を立ち上げると、「ファイル」メニュー内にある既存文書を開くためのどのオプションからでもPDFファイルを開くことができる。

 デフォルトのSPIではDrawアプリケーションによってPDFファイルが開かれるが、Impressを使うこともできる(DrawとImpressは多くのコードを共有している)。最初はこのデフォルト設定が奇妙に思えるかもしれない。PDFファイルがテキスト文書の場合はなおさらだ。だが実は、PDF形式の制約を考えるとDrawの利用は道理にかなっているといえる。どんなアプリケーションもPDFの書式を保持したまま複数行の編集を行うことはできない。PDFの仕様を書いたAdobeによるプロプライエタリなPDFエディタAcrobatでさえそうだ。こうした制約の下ではDrawへのインポートが合理的である。というのもDrawはそれぞれの行を別々の編集用オブジェクトとして扱えるからだ。SPIでは段落の配置を調整するのに1行ずつ編集しなければならなかったり、行の追加に工夫が必要だったりするが、それは決してこのエクステンションがほかのPDFエディタよりも劣っているからではない。

 それに、SPIのユーザインタフェースは比較的使いやすく作られている。一度に1行しか編集できないという制限以外で特に困る点といえば、編集時のオートコレクトを有効にしていると各行の先頭文字が勝手に大文字になることぐらいだろう。

 テストしたところ、SPIによるテキストのインポートの成否は、文書で使われているフォントに大きく依存した。非常にうまくいくケースでは、インポートするPDFファイルのフォントがシステムにインストールされてさえいればよかった。そうでない場合、SPIは代替フォントを使用するが、それらが元のフォントとは文字間隔の対応がとれていないこともあった。また、HelveticaやTimes Romanのような一般的なフォントについてはほとんど問題がないが、SPIによるPostScriptフォントの扱いには比率の読み取りや表示の正確さの点で問題があるようだ。表示上の問題は多くの場合、テキストオブジェクトに変換された1行分のテキストの形で現れ、余白を越えてページ外に文字が飛び出る、書式の再設定が効かないといった現象を引き起こす。すべての行間に空白がランダムに挿入されるという状況になる場合もある。

 今回のテストでは、PDFファイルのグラフィックのほうもインポートの成否はテキストの場合と似たようなものだった。グラフィックの多くは何の問題もなくDrawにインポートでき、グラフィック内のテキストも元の文書と同じスタイルで取り込めた。ただし、一部のPNG画像(すべてではない)が上下逆になったり、グラフィックが編集不可能なオブジェクトになったりするケースがあった。また、レイアウトが複雑な場合にはグラフィックの位置が10ピクセルほどずれることもあった。

 このベータ版のSPIでは、PDFフォームを扱うことができない。また、テキストの配置が常に保存されるとは限らず、完全に両端揃えになっていたテキストが左寄せの形で表示される傾向が強い。オンライン文書の多くには欠かせないハイパーリンクもサポートされていない。

 とはいえ、ほかの部分に目を向ければ、SPIで処理できることは問題点の数よりもはるかに多い。テキストフレームやセクション、複数レベルの箇条書き、それに境界や背景色を含む表の書式設定は、すべて問題なくインポートされ、今後に期待が持てるエクステンションといえる。

 一方、フォントとグラフィックの表示に関する問題は、OpenOffice.org 3.0と同様、SPIがまだプロダクション環境では使えないことを意味している。

 ベータ版の段階とはいえSPIは、グラフィックではなくテキストだけをPDFファイルから抽出するAbiwordや、行の分割以外の書式がほとんど保存されないKWordよりも優れている。

 しかし現状のSPIでは、インポートが1ページに制限される点とハイパーリンクを保存できない点くらいしか主な制約がないInkscapeにはかなわない。また、信頼性の面では、上級ユーザ指向ではあるがGNU/Linuxデスクトップ環境向けの手堅いPDFエディタであるPDFeditに遅れをとっている。ただし、今後数か月で多くの開発項目がSPIに追加される可能性がある。このまま最初の頃のように開発が続けば、最終版はOpenOffice.orgにとって必須のエクステンションと呼べるものになるだろう。

Bruce Byfieldは、Linux.comに定期的に寄稿しているコンピュータ分野のジャーナリスト。

Linux.com 原文