2017年04月01日

OMR(光学楽譜認識)の研究開発のための,アノテーション情報つきデータセット「MUSCIMA++」.

Web拍手:


「In Search of a Dataset for Handwritten Optical Music Recognition: Introducing MUSCIMA++」
https://arxiv.org/pdf/1703.04824.pdf

「MUSCIMA++ | ÚFAL」
https://ufal.mff.cuni.cz/muscima


MUSCIMA++ is a dataset of handwritten music notation for musical symbol detection. It contains 91255 symbols, consisting of both notation primitives and higher-level notation objects, such as key signatures or time signatures. There are 23352 notes in the dataset, of which 21356 have a full notehead, 1648 have an empty notehead, and 348 are grace notes. Composite objects, such as notes, are captured through explicitly annotated relationships of the notation primitives (noteheads, stems, beams...). This way, the annotation provides an explicit bridge between the low-level and high-level symbols described in Optical Music Recognition literature.


MUSCIMA++ has annotations for 140 images from the CVC-MUSCIMA dataset [2], used for handwritten music notation writer identification and staff removal. CVC-MUSCIMA consists of 1000 binary images: 20 pages of music were each re-written by 50 musicians, binarized, and staves were removed. We had 7 different annotators marking musical symbols: each annotator marked one of each 20 CVC-MUSCIMA pages, with the writers selected so that the 140 images cover 2-3 images from each of the 50 CVC-MUSCIMA writers. This setup ensures maximal variability of handwriting, given the limitations in annotation resources.


「The CVC-MUSCIMA Database」
http://www.cvc.uab.es/cvcmuscima/index_database.html

「4. Annotation Instructions − MUSCIMarker 1.0a documentation」
https://muscimarker.readthedocs.io/en/develop/instructions.html

「Tools for working with the MUSCIMA++ dataset of handwritten music notation.」
https://github.com/hajicj/muscima

「muscima – tools for the MUSCIMA++ dataset − muscima 0.3.0 documentation」
https://muscima.readthedocs.io/






OMR(光学楽譜認識)の研究開発のための,アノテーション情報つきデータセット「MUSCIMA++」.




posted by NOIKE at 18:38 | 東京 ☁ | Comment(0) | TrackBack(0) | コンピュータ | このブログの読者になる | 更新情報をチェックする

“MNX”プロジェクト.楽譜を記述するためのデータ形式を策定するプロジェクトの仮の名称.W3C の Music Notation Community Group 内のプロジェクト.

Web拍手:


(ここに書くのを忘れていた.書いたような気がするのだけどなぁ... .)




「mnx」
https://w3c.github.io/mnx/


Music Notation CG next-generation music markup proposal.
Read the current MNX overview, currently an early draft proposal.



「MNX Proposal Overview」
https://w3c.github.io/mnx/overview/

「w3c/mnx: Music Notation CG next-generation music markup proposal.」
https://github.com/w3c/mnx/


“MNX”プロジェクト.
楽譜を記述するためのデータ形式を策定するプロジェクトの仮の名称.
W3C の Music Notation Community Group 内のプロジェクト.
プロジェクト名称“MNX”は,あとで変えるかもしれないけれど,とりあえず,呼びやすくするために“MNX”としている,らしい.
“MNX”は,“Music Notation X”.
X は,“extensibility”,あるいは,“next”,あるいは,“未知のもの(unknown)”,あるいは,ローマ数字の10,あるいは,単なる文字.


まだ,Proposal(提案)の状態で,変わる部分もだいぶあるようだけれど,現状についての私のざっくりした理解だと,


o MusicXML を考え方のベースにしているとはいえ,MusicXML とはだいぶ違うっぽい.

o MusicXML to MNX のコンバータは用意されるらしい.逆は(たぶん)用意されない.そもそも,MusicXML との後方互換性は考慮されない.

o 音符の長さを division を単位として表現することはしない.だから,MusicXML にあった,曲の途中で division が変わるせいで,データを読み書きするときのめんどくささはなくなるっぽい.おぉっ!


という感じ.
Proposal が Proposal 状態ではなくなったときに,一度,先頭からちゃんと読まないといけないかもしれない.
現状は,Proposal とはいえ,ほぼ draft 状態.
先行して読んでしまってもいいのだろうけれど,私は英語が得意というわけではなく苦手なので,もう少し仕様が固まってから読みたい.






















==

2015年08月15日
W3C Music Notation Community Group の Github リポジトリ,w3c/musicxml ができていた.ということは,大昔に私がやろうとしていた「MusicXML の DTD の日本語版」をいまから作業するとしたら,Github 上で作業して PR すればいいのかな.それは楽だー.
http://knoike.seesaa.net/article/424227537.html

2015年07月29日
MakeMusic は,MusicXML の今後の開発(仕様の改定など)を,W3C の「Music Notation Community Group」に移転したそうです.
http://knoike.seesaa.net/article/423179504.html

2008年10月01日
MusicXML Version History の意訳を更新した(2008-09-11)
http://knoike.seesaa.net/article/152835648.html

2008年06月19日
「MusicXML 更新履歴(Version History) の意訳」を更新した
http://knoike.seesaa.net/article/152833703.html

2007年09月29日
MusicXML の DTD の日本語版
http://knoike.seesaa.net/article/152831163.html


posted by NOIKE at 16:12 | 東京 ☁ | Comment(0) | TrackBack(1) | コンピュータ | このブログの読者になる | 更新情報をチェックする