産総研、ユーザーの協力で性能向上する音声検索システムを開発

 独立行政法人 産業技術総合研究所(産総研)は2008年6月12日、ユーザーの協力で日々性能が向上する音声情報検索技術を開発したと発表した。これを利用したインターネットの日本語音声データ(ポッドキャスト)の全文検索エンジン「PodCastle」(ポッドキャッスル)を一般公開した。

 不特定多数のユーザーが簡単操作で誤認識を訂正できる新インタフェースを開発。その結果を学習・反映させることで、音声検索性能と音声認識性能を向上させることが可能という。同時に、インターネット上のニュース記事や辞書などから新しい言葉を自動学習する技術も開発した。

 「PodCastle」は実証実験のために公開したもので、日本語ポッドキャストの全文検索機能およびユーザーによる誤認識訂正インタフェースを提供。「Googleニュース」「Yahoo!ニュース」掲載記事や、ユーザーの協力で構築されているネット辞書「はてなダイアリーキーワード」を使って新語を自動学習して認識精度を高める。

 13日現在、約330のポッドキャスト、約2万のエピソードの検索に対応している。対象ブラウザはInternet Explorer 6/7または Firefox 1.5/2.0、Safari 2/3。音声再生プラグインQuickTime 7以上、またはFlash 7以上が必要。

 今後は産業界と連携して実用化し、Webサービスやロボット、コールセンター、会議議事録作成などに応用してゆく考え。また、同研究で提案した「ユーザーによる誤り訂正や、インターネット上の情報で性能が向上していくパターン認識技術」という概念について、音声認識以外の分野での有効性も検証する。【鴨沢 浅葱/Infostand】

産総研
http://www.aist.go.jp/

PodCastle
http://podcastle.jp/