2013年12月18日

SIGMUS101 のプログラムをざざざと眺めてみた.「(9) SOM を用いた歌唱合成のための音声合成手法 山田 浩之(東京大学), 高野 明彦(国立情報学研究所)」がすごいのかも.音で聴いてみたい.現在,「Palette Synthesizer」という歌唱合成システムを開発中とのこと.

Web拍手:


「音楽情報科学研究会 ≫ 第101回情報処理学会音楽情報科学研究会の参加案内」
http://www.sigmus.jp/?page_id=2618


SIGMUS101 のプログラムをざざざと眺めてみた.
「(9) SOM を用いた歌唱合成のための音声合成手法 山田 浩之(東京大学), 高野 明彦(国立情報学研究所)」がすごいのかも.
接続合成系ではなく,規則合成系.
少ない録音からパラメータを学習するために,SOM(自己組織化モデル)を使う.
パラメータ学習実験の結果は,32次の LPC に匹敵.誤差 3.807 dB.
小さくはないような気もするのだけど,素人なので小さいのか大きいのかよくわからない.
Klatt & Klatt の規則合成系は 5.300 dB もあって大きいなぁ,と思ったら,1990年の論文なのか.
オープンソースになっていて利用しやすかったのがこれ,ということなのかな.

「まとめ」に,「最高品質のシンセサイザにとってまだ充分に低いとは言えない」と書いてある.
学習自体はうまくいっているけれど,歌声合成品質はまだあんまり高くない?

確かに,声質の再現性の観点からは接続合成系のほうが有利だけど,規則合成系のほうがいろいろと応用が効きますよね.
録音量も少なくて済むし,再構成系もコンパクトに作れるし.AquesTalk のように.


音で聴いてみたい.
現在,「Palette Synthesizer」という,音素マップを絵画のパレットに見立てた歌唱合成システムを開発中とのこと.
そのうち,公開されるのかな?


【コンピュータの最新記事】
posted by NOIKE at 02:57 | 東京 ☀ | Comment(0) | TrackBack(1) | コンピュータ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック

SIGMUS101 の「(9) SOM を用いた歌唱合成のための音声合成手法」 Ustream で観た.いまのところ,まだちょっと品質が低いような.研究を始めたばかりのような感じ.
Excerpt: 「音楽情報科学研究会 ≫ 第101回情報処理学会音楽情報科学研究会の参加案内」 http://www.sigmus.jp/?page_id=2618 「sigmus101 セッション3」 http:..
Weblog: とり茶
Tracked: 2014-01-04 17:06
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。