Julius は音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPC上でほぼ実時間で実行でき,認識率は90%以上です。言語モデル・音響モデルを任意に入れ替えられ,高い汎用性を持ちます.
登録日: 2002-09-09 14:38
|
関連プロジェクトスクリーンリーダーNVDA日本語版, GalateaTalk, MMDAgent, SNP Monitor!, galatea |
Linphoneは、GTK+とコンソール・インタフェースを備えた音声と映像を扱うインターネット電話です。これは、SIPプロトコルを使用しており、ほとんどのSIPクライアント並びにゲートウェイと互換性があります。これは、Speex、GSM、G711、G722、ilbc、amr、Theora、H263-1998、MPEG4、H264、VP8及びsnowのような様々な音声と映像コーデックを使うことができます。
関連プロジェクトDumpper, VirtualDubMod-jp, Julius, MeCab, OpenTween |
FAACプロジェクトは、AACエンコーダFAACおよびAACデコーダFAAD2からなります。これは、複数のMPEG4オブジェクトタイプ(LC,Main,LTP,HE AAC,PS)およびファイルフォーマット(ADTS AAC, raw AAC, MP4)、マルチチャンネル, ギャップレスのエンコードおよびデコードをサポートし、MP4のメタデータタグもサポートします。このコーデックは、標準準拠のオーディオアプリケーションと互換性があります。
関連プロジェクトDumpper, HandBrake日本語版, PukiWiki, Julius, PeaZip |
Speex はパテントフリーの圧縮形式で、特に音声に適しています。2-45 kbpsの範囲の低ビットレートでの音声通信に特化しています。想定している用途には、VoIP、インターネット越しの音声ストリーミング、オーディオブック、音声データの記録保存(例えばボイスメール)が含まれます。
MisterHouseは、UnixとWindowsで使えるホームオートメーションのプログラムで、Perlで書かれています。声による命令、Webブラウザ、時刻、シリアルポートとX10のデータ、外部ファイルなどに応答させることができます。Text to Speechエンジンを介して音声で話をさせることもできます。
関連プロジェクトMeCab, Dumpper, Media Player Classic - Homecinema, MPC-BE, Julius |
eSpeak は良質の英語と他の言語のテキストを音声にコンパクトなエンジンです。その明確な調音と良いイントネーションは、長いテキストの記事を聞くために適した。コマンド行からテキスト ファイルを話すことができるし、お祭りやその他の同様のプログラムに代わるものとして「話し手」KDE TTS システム内のそして Gnome 音声ドライバーとして動作します。Windows SAPI5 とコマンドライン バージョンも利用できます。
関連プロジェクトスクリーンリーダーNVDA日本語版, Darik's Boot and Nuke (DBAN), SmillaEnlarger, iReport-Designer for JasperReports, 円盤複写屋 |
CMU Sphinx 音声認識システムは、オープンソースに移行中です。配布物には、ライブラリ (libsphinx2) と、それにリンクすることで動作するいくつかの小さな例が含まれています。
関連プロジェクト円盤複写屋, Julius, Media Player Classic - Homecinema, スクリーンリーダーNVDA日本語版, Dumpper |
Sphinx-4 は、不特定話者、連続音声認識システムです。
関連プロジェクトスクリーンリーダーNVDA日本語版, MeCab, Julius, Media Player Classic - Homecinema, PeerCast IM |
PHP Voice は、以前には PHP-VXML (Voice XML)として知られており、音声指示でコンピュータを操作するために必要なユーザーインターフェースを構築するための PHP スクリプトを用いた XML ベースの言語の VXML です。 PHP Voice は、PHP を用いた音声アプリケーションの開発を支援する4つのクラスを持っています。PHP Voice は、音声合成マークアップ言語 1.0 、音声認識文法仕様 1.0、音声ブラウザコールコントロール CCXML 1.0 および音声拡張マークアップ言語( VoiceXML ) 2.0 をサポートしています。
関連プロジェクトPukiWiki, DeSmuME, Amateras, Media Player Classic - Homecinema, Darik's Boot and Nuke (DBAN) |
!FlowDesigner はデータ フロー指向開発環境です。それは小さく、再利用可能なビルディング ブロックを組み合わせることで複雑なアプリケーションの構築に使用できます。いくつかの方法でも Simulink と !LabView のようなほとんどのいずれかのクローン 。
関連プロジェクトTERASOLUNA Framework, Dumpper, Media Player Classic - Homecinema, SharpDevelop-jp, MeCab |
!SpeechLion はデスクトップ コマンドと制御のための音声認識アプリケーションです。スフィンクス 4 認識に基づいているし、簡単な音声コマンドを使用して Linux デスクトップを制御するユーザーことができます。いくつかの例のコマンドは、「ボリューム ミュート」「ヘルプを表示する」、「次のウィンドウ」「マウスをクリックして」"ブラウズ google"。!SpeechLion は、Web Firefox 簡単な Emacs、ウィンドウ コントロール、ボリューム コントロールや使用量の詳細を介してブラウジングのためのハイレベル コマンドを認識します。アドホック キーボード ショート カットとマウス操作のための低レベルのコマンドもあります。
関連プロジェクトStepMania Japan, iReport-Designer for JasperReports, SmillaEnlarger, DeSmuME, Darik's Boot and Nuke (DBAN) |
スナック サウンドの拡張子追加サウンド再生/録音と音の可視化のためのコマンドなど波形とスペクトロ グラム。メモリ内のサウンド オブジェクト、ベース ファイルのオーディオ、ストリーミング オーディオ、MP3、AIFF、AU WAV ファイル形式、同期および非同期の再生をサポートしています。可視化キャンバス アイテム タイプ リアルタイムで更新し、postscript を出力することができます。スナック C API を使用して新しいコマンドおよびファイル形式を追加できます。
関連プロジェクトAmateras, Dumpper, Julius, おーぷんMIDIぷろじぇくと, Media Player Classic - Homecinema |
!SndBite は、偉大な効率で大規模なレコーディング小さなコンポーネントに分割するために設計された特殊なオーディオ エディターです。主たるものアプリケーションは言語の研究でさらに処理する前に別のファイルに各単語や文を配置することが求められます。また、一時停止期間を測定するために便利ですです。その機能を含む複数の同時ビュー異なる解像度、ゼロ交差ポイント カットの自動設定と静けさの音間の遷移にウィンドウの端を配置することで波形のユーザー、およびオプションの自動再生ウィンドウ動体上で容易に制御ファイル名の自動生成。スクリプト可能なあり、GUI なしのバッチモードで実行可能性があります。
関連プロジェクトJulius, Darik's Boot and Nuke (DBAN), iReport-Designer for JasperReports, SmillaEnlarger, 円盤複写屋 |
リアルタイム コミュニケーション ソフトウェア リモート ゲーマーに面と向かっての利点を提供するために建てられました。
関連プロジェクトunofficial gpSP kai, MeCab, MAME Spirits, MPC-BE, PukiWiki |
ジュリアスは、音声に関する研究及び開発のための高パフォーマンスの大語彙連続音声認識 (LVCSR) エンジンです。あなた自身の音声認識システムを構築する必要しますが、あります別英語音響モデルと言語モデルや文章校正ファイル。
関連プロジェクトDeSmuME, SmillaEnlarger, PukiWiki, iReport-Designer for JasperReports, Darik's Boot and Nuke (DBAN) |