米Hortonworks、Hadoopベースのデータ管理プラットフォームを発表

 米Hortonworksは6月12日(米国時間)、「Hortonworks Data Platform 1.0」を発表した。Apache Hadoopベースの企業向けデータ管理プラットフォームで、これを利用することでHadoopをより容易に利用できるという。

 Hortonworks Data Platform(HDP)はHadoopベースのデータ管理プラットフォームで、データの読み込み、保存、処理、管理が可能。構造化データおよび非構造化データ対応し、企業は既存のデータアーキテクチャを拡大して大規模なデータを効率よく処理できるという。

 特徴としては、Hadoopで利用されるHadoop Distributed File System(HDFS)のNameNodeやJobTrackerのフェイルオーバーおよび再起動の自動化、MapReduceでの問題検出およびHDFSのフェイルオーバーイベントへのレスポンスなどの自動化、サーバーやOSでの問題検出と仮想マシンの再起動の自動化、スマートなリソース管理などが挙げられている。

 HDP 1.0ではスクリプト言語「Apache Pig」やクエリ操作「Apache Hive」、スケジュールとワークフロー「Apache Oozie」、NoSQLデータベース「Apache HBase」など、Hadoopで併用されるオープンソースコンポーネントの組み合わせで構築されており、クラスタのプロビジョニングやモニタリング技術「Apache Ambari」も統合。「Apache HCatalog」を土台としたメタデータカタログも含んでおり、データの相互運用性もあるという。データ統合サービスでは「Talend Open Studio」を統合、データソースを接続して複雑なロジックを構築することなどができるという。

 Hortonworksは、2011年に米Yahoo!のHadoopチームがスピンオフしてできたベンチャー企業。HDPは15日にリリースを予定している。

米Hortonworks
http://hortonworks.com/