Semi-supervised Learning from Unfavorably Distributed Data
Název práce v češtině: | Semi-supervised učení z nepříznivě distribuovaných dat |
---|---|
Název v anglickém jazyce: | Semi-supervised Learning from Unfavorably Distributed Data |
Klíčová slova: | Semi-supervised učení, Hluboké učení, Nevyvážená distribuce |
Klíčová slova anglicky: | Semi-supervised Learning, Deep Learning, Unbalanced distribution |
Akademický rok vypsání: | 2019/2020 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Katedra teoretické informatiky a matematické logiky (32-KTIML) |
Vedoucí / školitel: | Mgr. Martin Pilát, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 10.02.2020 |
Datum zadání: | 24.02.2020 |
Datum potvrzení stud. oddělením: | 12.03.2020 |
Datum a čas obhajoby: | 08.07.2020 09:00 |
Datum odevzdání elektronické podoby: | 28.05.2020 |
Datum odevzdání tištěné podoby: | 28.05.2020 |
Datum proběhlé obhajoby: | 08.07.2020 |
Oponenti: | doc. RNDr. Iveta Mrázová, CSc. |
Zásady pro vypracování |
Semi-supervised učení je technika strojového učení kombinující učení s učitelem a učení bez učitele. Jeho cílem je během učení modelu využít vyjma označkovaných dat, pro která známe požadované výstupy, i mnohdy snadněji dostupná neoznačkovaná data, pro která požadované výstupy neznáme. Tím se snaží řešit častý problém s nedostatkem trénovacích dat, případně zlepšit robustnost naučeného modelu i když máme trénovacích dat dostatek. I přes poměrně rozsáhlý výzkum v této oblasti trpí známé metody semi-supervised učení mnoha problémy, které dosud výrazně omezovaly jejich využitelnost v praxi. Jedna ze situací kdy tyto problémy nastávají je, když mají označkovaná trénovací data a neoznačkovaná trénovací data rozdílné charakteristiky. Cílem diplomové práce je navrhnout metodu zmírňující tyto problémy.
Student si prostuduje dostupnou literaturu o semi-supervised učení a na jejím základě navrhne nové metody nebo vylepšení stávajících metod semi-supervised učení tak, aby byly robustnější vzhledem k rozdílným distribucím označkovaných a neoznačkovaných dat. Navržené metody nebo vylepšení následně student porovná s existujícími metodami semi-supervised učení. |
Seznam odborné literatury |
[1] Avital Oliver, Augustus Odena, Colin Raffel, Ekin D. Cubuk, Ian J. Goodfellow. "Realistic Evaluation of Deep Semi-Supervised Learning Algorithms". arXiv:1804.09170. 2018.
[2] Olivier Chapelle, Bernhard Scholkopf,and Alexander Zien. "Semi-Supervised Learning". MIT Press, 2006. ISBN: 978-0262033589 [3] Andreas Look, Stefan Riedelbauch: "Dealing with Limited Access to Data: Comparison of Deep Learning Approaches". In: 2019 International Joint Conference on Neural Networks (IJCNN 2019). IEEE 2019. DOI: 10.1109/IJCNN.2019.8852064 |