ダウンロードリスト

プロジェクト概要

デュークは、高速かつ柔軟な記録リンケージ エンジンです。従来のブロック (キーによってソート) アプローチを使用しないが、Lucene 代わりに依存しています。これは、高パフォーマンス (~ 10 分で 1,000,000 のレコードを処理することができる)。デュークは、コマンドラインから実行できますがまたインクリメンタル リンク アプリケーションを簡単に構築できるように API を持っています。CSV、JDBC、SPARQL、NTriples からのデータの読み取りをサポートし、またコンパレータ文字列と文字列の正規化の数をサポートしています。

システム要件

システム要件が設定されていません
プロジェクトのリリース情報やプロジェクトリソースの情報です。
注: プロジェクトリソースの情報は Freecode.com ページからの引用です。ダウンロードそのものは、OSDNにホスティングされているものではありません。

2012-01-14 01:18
0.4

このリリースより柔軟な API、新しいクリーナー (個人名) を 2 つの新しいデータ ソース (メモリ内、JNDI とバグ修正の数を追加します。いくつかの追加のユーティリティも追加されています。
This release adds a more flexible API, a new cleaner (for personal names), two new data sources (in-memory and JNDI), and a number of bugfixes. Some additional utilities have also been added.

2011-09-12 02:05
0.3

このリリースではクリーンアップされたAPIとより多くのコンパレータを提供しています。
This release offers a cleaned-up API and more comparators.

2011-06-02 16:55
0.2

このバージョンでは、数多くのバグを修正し、多くの改良が追加されています。例データと設定は、現在の配布に含まれています。 verboseオプション - ニューヨークJaroWinklerTokenizedとDifferentComparatorコンパレータは、CSV形式のデータソース内のコマンドをDebugCompare、より多くの新たな柔軟性、構成エラーの優れたレポートと一緒に提供されていました。
This version fixes a number of bugs and adds a number of improvements. Example data and setup are now included in the distribution. New JaroWinklerTokenized and DifferentComparator comparators were provided along with a new DebugCompare command, more flexibility in the CSV data source, better reporting of configuration errors, and a --verbose option.

2011-05-21 07:46
0.1

最初のバージョン。
The first version.

プロジェクトリソース