2017年02月12日

Blizzard Challenge に,前処理済みのデータが用意された課題も設置されたらしい.研究者ではないエンジニアでも取り組めそうな課題ですね.

Web拍手:


「Blizzard Challenge 2017 - SynSIG」
https://synsig.org/index.php/Blizzard_Challenge_2017


Blizzard Challenge に,前処理済みのデータが用意された課題も設置されたらしい.
音声言語処理に関する前処理のノウハウを持っていなくても参加できる,ほぼ機械学習のコンテスト.
2017-ES1 と 2017-ES2 がそれであるとのこと.

[ibisml:1182] での徳田先生の解説によれば,

「Blizzard Machine Learning Challenge 2017 - Google グループ」
https://groups.google.com/forum/#!msg/ibisml/mbrM-hQLlZI/UxT7kF3GCwAJ


参加者は,機械学習向けに整理されたデータを用いて,直接的な機械学
習問題として音声合成の問題に取り組むことができます。提供されるデー
タは,言語特徴列と対応する音声特徴列(あるいは音声波形)です。音
声特徴列を音声波形に変換するツールも用意されます。参加者は,言語
特徴列から音声特徴列を予測するモデルを学習します(2017-ES1タス
ク)。あるいは,WaveNetのように言語特徴列から音声波形を直接予測
するモデルを学習します(2017-ES2タスク)。

評価時には,新たに与えられた言語特徴列から,学習したモデルを用い
て音声特徴列,あるいは音声波形を予測します。これまでのBlizzard
Challengeと同様,大規模な受聴試験に基づいた主観評価によってそれ
ぞれのシステム性能が評価されます。



つまり,音声ファイルと言語とのアライメント(位置合わせ)などはすでに済ませてあるデータセットが利用できるらしい.
実用的なシステムを考える場合は,そのあたりがうまくできるかどうかもかなり重要な課題なのだけど,まずは機械学習そのものの問題に取り組みましょう,ということなのだろうと思う.

研究者ではないエンジニアでも取り組めそうな課題ですね.




==

2014年03月28日
「Blizzard Challenge 2014 - SynSIG」 共通の音声データベースを用いた比較・評価により,様々な音声合成手法をより良く理解することを目的とした「Blizzard Challenge」.2014 は,インドの6言語が対象.
http://knoike.seesaa.net/article/392867905.html


【コンピュータの最新記事】
posted by NOIKE at 17:48 | 東京 ☀ | Comment(0) | TrackBack(0) | コンピュータ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック