ダウンロードリスト

プロジェクト概要

Texterizeは、テキストやメタデータを抽出するツールおよびライブラリで、ファイルからテキストコンテンツを素早く取得するのに使われます。 現在サポートしているファイル形式は次の通りです;PDF、Excel、Powerpoint、Word、RTF、WordPerfect、MP3、Ogg、および全てのOpenDocumentファイルフォーマット Texterizeが出力するファイルはテキストおよびXML形式です。 Unicodeの入出力が可能であり、UTF-8がデフォルトの出力文字コードです。 Texterizeはまた、ディレクトリ全体(またはファイルシステム全体)をテキストに変換可能な再帰モードをも備えています。 この再帰モードは、アーカイブファイルや圧縮ファイル(zip、tar、gzなど)も変換対象としています。

システム要件

システム要件が設定されていません
プロジェクトのリリース情報やプロジェクトリソースの情報です。
注: プロジェクトリソースの情報は Freecode.com ページからの引用です。ダウンロードそのものは、OSDNにホスティングされているものではありません。

2009-10-05 18:13
0.1.3

サポートMSを書き、KOfficeのフォーマットを追加しました。シンプルなテキスト抽出AmiProから(。ヨンサムファイル)、OOXMLはサポートされておよびdBase。コンパイルは、外部objdirとglibのバージョン2.0、2.2、2.4で動作し、2.6。 PDFをサポートするオプションです。バグ修正したtarファイルの抽出がなされた。
Support was added for MS Write and the KOffice formats. Simple text extraction is supported from AmiPro (.sam files), OOXML, and dBase. Compiling now works with external objdir and glib versions 2.0, 2.2, 2.4, and 2.6. PDF support is now optional. Bugfixes were made to tarfile extraction.

2008-02-03 13:54
0.1.2

多くのクラッシュファジングを通じて発見修正されました。いくつかの主要なPDFのバグ(フォントパーサのバグを0.1.1で導入を含む)で修正された。 configureスクリプトが改善された(これ以上)CFLAGSを余儀なくされた。
タグ: Major bugfixes
Many crashes found through fuzzing were fixed.
Some major PDF bugs were fixed (including a font
parser bug introduced in 0.1.1). The configure
script was improved (no more forced CFLAGS).

プロジェクトリソース