Thesis (Selection of subject)Thesis (Selection of subject)(version: 385)
Thesis details
   Login via CAS
Rychlé rozpoznávání notopisů pomocí platformy YOLO
Thesis title in Czech: Rychlé rozpoznávání notopisů pomocí platformy YOLO
Thesis title in English: Fast Optical Music Recognition Using the YOLO Platform
Key words: optické rozpoznávání notopisů|detekce objektů|hluboké učení
English key words: optical music recognition|object detection|deep learning
Academic year of topic announcement: 2024/2025
Thesis type: Bachelor's thesis
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: Mgr. Jiří Mayer
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 19.02.2025
Date of assignment: 19.02.2025
Confirmed by Study dept. on: 19.02.2025
Date and time of defence: 20.06.2025 09:00
Date of electronic submission:07.05.2025
Opponents: doc. RNDr. Elena Šikudová, Ph.D.
 
 
 
Guidelines
Automatické rozpoznávání notopisů (Optical Music Recognition - OMR) je úloha, ve které se sken fyzického dokumentu obsahující notový zápis algoritmicky převádí do strojově čitelného tvaru. Tento převod lze řešit buď pomocí tzv. end-to-end modelů, které se jej učí jako jeden krok a nebo pomocí objektových detektorů a následného skládání objektů do notačního grafu a jeho interpretace. Přestože end-to-end přístup dosahuje v posledních letech značných úspěchů [1] [2], tyto modely jsou velké a jejich aplikace trvá od jednotek po desítky sekund na jednu stránku notopisu. To komplikuje jejich nasazení např. pro účely indexování a prohledávání knihoven a archivů, které mohou obsahovat řádově milióny stránek. Paralelně s vývojem end-to-end modelů pro OMR se v posledních letech zlepšily obecné objektové detektory, které nyní dokážou zpracovat desítky stránek za sekundu [3] [4]. Cílem práce je postavit rychlý systém na rozpoznávání notopisů kolem objektového detektoru YOLO a následně vyhodnotit jeho přesnost.
References
[1] Antonio Ríos-Vila, Jorge Calvo-Zaragoza, and Thierry Paquet: Sheet music transformer: End-to-end optical music recognition beyond monophonic transcription. In: Computing Research Repository, abs/2402.07596. URL: http://arxiv.org/abs/2402.07596 (2024)
[2] Jiří Mayer, Milan Straka, Jan Hajič jr., and Pavel Pecina: Practical end-to-end optical music recognition for pianoform music. In: 16th International Conference on Document Analysis and Recognition (ICDAR), pages 55–73, Athens, Greece. URL: https://doi.org/10.1007/978-3-031-70552-6_4 (2024)
[3] Jan Hajic jr. and Pavel Pecina: Detecting Noteheads in Handwriten Scores
with ConvNets and Bounding Box Regression. In: Computing Research Repository, abs/1708.01806, 2017a. URL: http://arxiv.org/abs/1708.01806 (2017)
[4] Glenn Jocher, Ayush Chaurasia, and Jing Qiu: Ultralytics YOLO. URL: https://github.com/ultralytics (2023)
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html