Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Postprocessing syntetických notopisů v kontextu jejich rozpoznávání
Název práce v češtině: Postprocessing syntetických notopisů v kontextu jejich rozpoznávání
Název v anglickém jazyce: Postprocessing of Synthetic Sheet Music in the Context of Optical Music Recognition
Klíčová slova: optické rozpoznávání notopisů|syntéza dat|hluboké učení
Klíčová slova anglicky: optical music recognition|data synthesis|deep learning
Akademický rok vypsání: 2023/2024
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Jiří Mayer
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 25.03.2024
Datum zadání: 25.03.2024
Datum potvrzení stud. oddělením: 28.03.2024
Datum a čas obhajoby: 05.09.2024 09:00
Datum odevzdání elektronické podoby:16.07.2024
Datum odevzdání tištěné podoby:16.07.2024
Datum proběhlé obhajoby: 05.09.2024
Oponenti: Mgr. Jan Hajič, Ph.D.
 
 
 
Zásady pro vypracování
Metody hlubokého učení byly v posledních letech velkým přínosem v mnoha oblastech strojového zpracovávání dat. Trénování modelů hlubokého učení ovšem vyžaduje značné množství dat, které nemusí být pro některé úlohy dostupné. Jednou takovou úlohou je automatické rozpoznávání notopisů (Optical Music Recognition - OMR), kde se nedostatek dat doposud řešil syntézou dat umělých [1,2]. Běžně dostupné nástroje pro sázení notopisů ovšem produkují obrázky v tiskové kvalitě (nijak nedegradované), a tak svým vzhledem neodpovídají digitalizátům, například v knihovnách. Tato práce prozkoumá možnosti rozšíření současných metod syntézy notopisů o tzv. postprocessing, tedy umělou degradaci syntetických obrázků tak, aby více připomínaly ty reálné [3]. Cílem práce bude také vyhodnocení tohoto  postprocessingu na základní OMR úloze detekce symbolů [4].
Seznam odborné literatury
[1] Jiří Mayer and Pavel Pecina: Synthesizing Training Data for Handwritten Music Recognition. In: 16th International Conference on Document Analysis and Recognition (ICDAR). pp. 626-641. Lausane, Switzerland (2021)
[2] Lukas Tuggener, Yvan Putra Satyawan, Alexander Pacha, Jürgen Schmidhuber and Thilo Stadelmann: The DeepScoresV2 Dataset and Benchmark for Music Object Detection. In: 25th International Conference on Pattern Recognition (ICPR). pp. 9188-9195. Milan, Italy (2021)
[3] Alexei A. Efros and William T. Freeman: Image Quilting for Texture Synthesis and Transfer. In: 28th Annual Conference on Computer Graphics and Interactive Techniques (SIGGRAPH). pp. 341-346. Los Angeles, California, US (2001)
[4] Jan Hajic jr. and Pavel Pecina: Detecting Noteheads in Handwriten Scores
with ConvNets and Bounding Box Regression. In: Computing Research Repository, abs/1708.01806, 2017a. URL: http://arxiv.org/abs/1708.01806 (2017)
 
Univerzita Karlova | Informační systém UK