Postprocessing syntetických notopisů v kontextu jejich rozpoznávání
Název práce v češtině: | Postprocessing syntetických notopisů v kontextu jejich rozpoznávání |
---|---|
Název v anglickém jazyce: | Postprocessing of Synthetic Sheet Music in the Context of Optical Music Recognition |
Klíčová slova: | optické rozpoznávání notopisů|syntéza dat|hluboké učení |
Klíčová slova anglicky: | optical music recognition|data synthesis|deep learning |
Akademický rok vypsání: | 2023/2024 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | Mgr. Jiří Mayer |
Řešitel: | skrytý![]() |
Datum přihlášení: | 25.03.2024 |
Datum zadání: | 25.03.2024 |
Datum potvrzení stud. oddělením: | 28.03.2024 |
Datum a čas obhajoby: | 05.09.2024 09:00 |
Datum odevzdání elektronické podoby: | 16.07.2024 |
Datum odevzdání tištěné podoby: | 16.07.2024 |
Datum proběhlé obhajoby: | 05.09.2024 |
Oponenti: | Mgr. Jan Hajič, Ph.D. |
Zásady pro vypracování |
Metody hlubokého učení byly v posledních letech velkým přínosem v mnoha oblastech strojového zpracovávání dat. Trénování modelů hlubokého učení ovšem vyžaduje značné množství dat, které nemusí být pro některé úlohy dostupné. Jednou takovou úlohou je automatické rozpoznávání notopisů (Optical Music Recognition - OMR), kde se nedostatek dat doposud řešil syntézou dat umělých [1,2]. Běžně dostupné nástroje pro sázení notopisů ovšem produkují obrázky v tiskové kvalitě (nijak nedegradované), a tak svým vzhledem neodpovídají digitalizátům, například v knihovnách. Tato práce prozkoumá možnosti rozšíření současných metod syntézy notopisů o tzv. postprocessing, tedy umělou degradaci syntetických obrázků tak, aby více připomínaly ty reálné [3]. Cílem práce bude také vyhodnocení tohoto postprocessingu na základní OMR úloze detekce symbolů [4]. |
Seznam odborné literatury |
[1] Jiří Mayer and Pavel Pecina: Synthesizing Training Data for Handwritten Music Recognition. In: 16th International Conference on Document Analysis and Recognition (ICDAR). pp. 626-641. Lausane, Switzerland (2021)
[2] Lukas Tuggener, Yvan Putra Satyawan, Alexander Pacha, Jürgen Schmidhuber and Thilo Stadelmann: The DeepScoresV2 Dataset and Benchmark for Music Object Detection. In: 25th International Conference on Pattern Recognition (ICPR). pp. 9188-9195. Milan, Italy (2021) [3] Alexei A. Efros and William T. Freeman: Image Quilting for Texture Synthesis and Transfer. In: 28th Annual Conference on Computer Graphics and Interactive Techniques (SIGGRAPH). pp. 341-346. Los Angeles, California, US (2001) [4] Jan Hajic jr. and Pavel Pecina: Detecting Noteheads in Handwriten Scores with ConvNets and Bounding Box Regression. In: Computing Research Repository, abs/1708.01806, 2017a. URL: http://arxiv.org/abs/1708.01806 (2017) |