Rychlé rozpoznávání notopisů pomocí platformy YOLO
Název práce v češtině: | Rychlé rozpoznávání notopisů pomocí platformy YOLO |
---|---|
Název v anglickém jazyce: | Fast Optical Music Recognition Using the YOLO Platform |
Klíčová slova: | optické rozpoznávání notopisů|detekce objektů|hluboké učení |
Klíčová slova anglicky: | optical music recognition|object detection|deep learning |
Akademický rok vypsání: | 2024/2025 |
Typ práce: | bakalářská práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | Mgr. Jiří Mayer |
Řešitel: | skrytý![]() |
Datum přihlášení: | 19.02.2025 |
Datum zadání: | 19.02.2025 |
Datum potvrzení stud. oddělením: | 19.02.2025 |
Datum odevzdání elektronické podoby: | 07.05.2025 |
Oponenti: | doc. RNDr. Elena Šikudová, Ph.D. |
Zásady pro vypracování |
Automatické rozpoznávání notopisů (Optical Music Recognition - OMR) je úloha, ve které se sken fyzického dokumentu obsahující notový zápis algoritmicky převádí do strojově čitelného tvaru. Tento převod lze řešit buď pomocí tzv. end-to-end modelů, které se jej učí jako jeden krok a nebo pomocí objektových detektorů a následného skládání objektů do notačního grafu a jeho interpretace. Přestože end-to-end přístup dosahuje v posledních letech značných úspěchů [1] [2], tyto modely jsou velké a jejich aplikace trvá od jednotek po desítky sekund na jednu stránku notopisu. To komplikuje jejich nasazení např. pro účely indexování a prohledávání knihoven a archivů, které mohou obsahovat řádově milióny stránek. Paralelně s vývojem end-to-end modelů pro OMR se v posledních letech zlepšily obecné objektové detektory, které nyní dokážou zpracovat desítky stránek za sekundu [3] [4]. Cílem práce je postavit rychlý systém na rozpoznávání notopisů kolem objektového detektoru YOLO a následně vyhodnotit jeho přesnost. |
Seznam odborné literatury |
[1] Antonio Ríos-Vila, Jorge Calvo-Zaragoza, and Thierry Paquet: Sheet music transformer: End-to-end optical music recognition beyond monophonic transcription. In: Computing Research Repository, abs/2402.07596. URL: http://arxiv.org/abs/2402.07596 (2024)
[2] Jiří Mayer, Milan Straka, Jan Hajič jr., and Pavel Pecina: Practical end-to-end optical music recognition for pianoform music. In: 16th International Conference on Document Analysis and Recognition (ICDAR), pages 55–73, Athens, Greece. URL: https://doi.org/10.1007/978-3-031-70552-6_4 (2024) [3] Jan Hajic jr. and Pavel Pecina: Detecting Noteheads in Handwriten Scores with ConvNets and Bounding Box Regression. In: Computing Research Repository, abs/1708.01806, 2017a. URL: http://arxiv.org/abs/1708.01806 (2017) [4] Glenn Jocher, Ayush Chaurasia, and Jing Qiu: Ultralytics YOLO. URL: https://github.com/ultralytics (2023) |