音声認識やります。幅を広げるためです。論文投稿できる学会の幅を。今のところMFCCはHTK任せ。その後をがんばってます。ちなみにHTKはCFLAGSをm64にして./configureしないとmake allできないことがあるので注意。
音声認識といっても、とりあえず、HTKのマニュアル読んで、真似しつつコーディングしてるだけ。いずれはベイズ化しよかな。その前に、普通にHMMで音素モデルをちゃんと作ってみよか、と。手はじめの実験のために用意したものは・・・。 まず、beep dictionary。たくさんの英単語を音素の列として書き下してあるデータ。次に、フリーの英単語読み上げWAVファイルデータ。でも、合成された音声なので、加えてexciteのオンライン英和辞典からほぼ全単語のwavファイルをクローリング(すいません)してリアルな音声も確保。さきほどのbeep辞書とこれらのwavファイルとの両方に出てくる単語を集めれば、英語の音素モデル作成実験用データ完成。
by tmasada2
| 2009-02-05 23:13
| らららルルル
|
カテゴリ
以前の記事
2009年 04月 2009年 03月 2009年 02月 2009年 01月 2008年 12月 2008年 11月 2008年 10月 2008年 09月 2008年 08月 2008年 07月 2008年 06月 2008年 05月 2008年 04月 2008年 03月 2008年 02月 2008年 01月 2007年 12月 2007年 11月 2007年 10月 2007年 09月 2007年 08月 2007年 07月 2007年 06月 2007年 05月 2007年 04月 2007年 02月 2007年 01月 2006年 12月 2006年 11月 2006年 10月 2006年 09月 2006年 08月 2006年 07月 2006年 06月 2006年 05月 2006年 04月 2006年 03月 2006年 02月 2006年 01月 2005年 12月 2005年 11月 2005年 10月 2005年 09月 2005年 08月 2005年 07月 2005年 06月 2005年 05月 2005年 03月 2005年 02月 2005年 01月 2004年 12月 その他のジャンル
検索
ファン
記事ランキング
ブログジャンル
画像一覧
|
ファン申請 |
||