Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Rychlé rozpoznávání notopisů pomocí platformy YOLO
Název práce v češtině: Rychlé rozpoznávání notopisů pomocí platformy YOLO
Název v anglickém jazyce: Fast Optical Music Recognition Using the YOLO Platform
Klíčová slova: optické rozpoznávání notopisů|detekce objektů|hluboké učení
Klíčová slova anglicky: optical music recognition|object detection|deep learning
Akademický rok vypsání: 2024/2025
Typ práce: bakalářská práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Jiří Mayer
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 19.02.2025
Datum zadání: 19.02.2025
Datum potvrzení stud. oddělením: 19.02.2025
Datum odevzdání elektronické podoby:07.05.2025
Oponenti: doc. RNDr. Elena Šikudová, Ph.D.
 
 
 
Zásady pro vypracování
Automatické rozpoznávání notopisů (Optical Music Recognition - OMR) je úloha, ve které se sken fyzického dokumentu obsahující notový zápis algoritmicky převádí do strojově čitelného tvaru. Tento převod lze řešit buď pomocí tzv. end-to-end modelů, které se jej učí jako jeden krok a nebo pomocí objektových detektorů a následného skládání objektů do notačního grafu a jeho interpretace. Přestože end-to-end přístup dosahuje v posledních letech značných úspěchů [1] [2], tyto modely jsou velké a jejich aplikace trvá od jednotek po desítky sekund na jednu stránku notopisu. To komplikuje jejich nasazení např. pro účely indexování a prohledávání knihoven a archivů, které mohou obsahovat řádově milióny stránek. Paralelně s vývojem end-to-end modelů pro OMR se v posledních letech zlepšily obecné objektové detektory, které nyní dokážou zpracovat desítky stránek za sekundu [3] [4]. Cílem práce je postavit rychlý systém na rozpoznávání notopisů kolem objektového detektoru YOLO a následně vyhodnotit jeho přesnost.
Seznam odborné literatury
[1] Antonio Ríos-Vila, Jorge Calvo-Zaragoza, and Thierry Paquet: Sheet music transformer: End-to-end optical music recognition beyond monophonic transcription. In: Computing Research Repository, abs/2402.07596. URL: http://arxiv.org/abs/2402.07596 (2024)
[2] Jiří Mayer, Milan Straka, Jan Hajič jr., and Pavel Pecina: Practical end-to-end optical music recognition for pianoform music. In: 16th International Conference on Document Analysis and Recognition (ICDAR), pages 55–73, Athens, Greece. URL: https://doi.org/10.1007/978-3-031-70552-6_4 (2024)
[3] Jan Hajic jr. and Pavel Pecina: Detecting Noteheads in Handwriten Scores
with ConvNets and Bounding Box Regression. In: Computing Research Repository, abs/1708.01806, 2017a. URL: http://arxiv.org/abs/1708.01806 (2017)
[4] Glenn Jocher, Ayush Chaurasia, and Jing Qiu: Ultralytics YOLO. URL: https://github.com/ultralytics (2023)
 
Univerzita Karlova | Informační systém UK