Rychlé rozpoznávání notopisů pomocí platformy YOLO
Thesis title in Czech: | Rychlé rozpoznávání notopisů pomocí platformy YOLO |
---|---|
Thesis title in English: | Fast Optical Music Recognition Using the YOLO Platform |
Key words: | optické rozpoznávání notopisů|detekce objektů|hluboké učení |
English key words: | optical music recognition|object detection|deep learning |
Academic year of topic announcement: | 2024/2025 |
Thesis type: | Bachelor's thesis |
Thesis language: | |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | Mgr. Jiří Mayer |
Author: | hidden![]() |
Date of registration: | 19.02.2025 |
Date of assignment: | 19.02.2025 |
Confirmed by Study dept. on: | 19.02.2025 |
Date and time of defence: | 20.06.2025 09:00 |
Date of electronic submission: | 07.05.2025 |
Opponents: | doc. RNDr. Elena Šikudová, Ph.D. |
Guidelines |
Automatické rozpoznávání notopisů (Optical Music Recognition - OMR) je úloha, ve které se sken fyzického dokumentu obsahující notový zápis algoritmicky převádí do strojově čitelného tvaru. Tento převod lze řešit buď pomocí tzv. end-to-end modelů, které se jej učí jako jeden krok a nebo pomocí objektových detektorů a následného skládání objektů do notačního grafu a jeho interpretace. Přestože end-to-end přístup dosahuje v posledních letech značných úspěchů [1] [2], tyto modely jsou velké a jejich aplikace trvá od jednotek po desítky sekund na jednu stránku notopisu. To komplikuje jejich nasazení např. pro účely indexování a prohledávání knihoven a archivů, které mohou obsahovat řádově milióny stránek. Paralelně s vývojem end-to-end modelů pro OMR se v posledních letech zlepšily obecné objektové detektory, které nyní dokážou zpracovat desítky stránek za sekundu [3] [4]. Cílem práce je postavit rychlý systém na rozpoznávání notopisů kolem objektového detektoru YOLO a následně vyhodnotit jeho přesnost. |
References |
[1] Antonio Ríos-Vila, Jorge Calvo-Zaragoza, and Thierry Paquet: Sheet music transformer: End-to-end optical music recognition beyond monophonic transcription. In: Computing Research Repository, abs/2402.07596. URL: http://arxiv.org/abs/2402.07596 (2024)
[2] Jiří Mayer, Milan Straka, Jan Hajič jr., and Pavel Pecina: Practical end-to-end optical music recognition for pianoform music. In: 16th International Conference on Document Analysis and Recognition (ICDAR), pages 55–73, Athens, Greece. URL: https://doi.org/10.1007/978-3-031-70552-6_4 (2024) [3] Jan Hajic jr. and Pavel Pecina: Detecting Noteheads in Handwriten Scores with ConvNets and Bounding Box Regression. In: Computing Research Repository, abs/1708.01806, 2017a. URL: http://arxiv.org/abs/1708.01806 (2017) [4] Glenn Jocher, Ayush Chaurasia, and Jing Qiu: Ultralytics YOLO. URL: https://github.com/ultralytics (2023) |