Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Evolutionary Algorithms for Data Transformation
Název práce v češtině: Transformace dat pomocí evolučních algoritmů
Název v anglickém jazyce: Evolutionary Algorithms for Data Transformation
Klíčová slova: vzdálenostní metriky, Mahalanobisova vzdálenost, redukce dimenze, evoluční algoritmy, vizualizace, transformace dat, neuronové sítě
Klíčová slova anglicky: distance metric learning, Mahalanobis distance, dimensionality reduction, evolutionary algorithms, visualisation, data transformation, neural networks
Akademický rok vypsání: 2016/2017
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Katedra teoretické informatiky a matematické logiky (32-KTIML)
Vedoucí / školitel: Mgr. Martin Pilát, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 15.12.2016
Datum zadání: 15.12.2016
Datum potvrzení stud. oddělením: 30.12.2016
Datum a čas obhajoby: 07.06.2017 10:00
Datum odevzdání elektronické podoby:15.05.2017
Datum odevzdání tištěné podoby:12.05.2017
Datum proběhlé obhajoby: 07.06.2017
Oponenti: Mgr. Roman Neruda, CSc.
 
 
 
Zásady pro vypracování
Transformace dat jsou důležitou součástí strojového učení, která výrazně ovlivňuje kvalitu vytvořených modelů. Transformace dat se často používají i pro jejich zobrazení do prostoru s menší dimenzí, kde se dají snáze vizualizovat. Většina metod ale funguje bez učitele a tedy není schopna najít taková zobrazení dat, která by brala v úvahu vlastnosti metod strojového učení, které následují po ní, případně se snažila vizualizaci upravit tak, aby data ze stejné třídy byla blízko u sebe. Některé metody určené přímo pro vizualizaci (jako např. t-SNE) navíc ani neposkytují transformační funkci a nejsou tedy schopny zobrazit nová data bez přepočítání celého zobrazení. Cílem práce je tedy pomocí kombinace evolučních algoritmů a dalších přístupů (např. neuronových sítí) navrhnout metody pro vytvoření transformační funkce, která bude brát v úvahu i označkování dat.

Student se seznámí s postupy pro automatické transformace dat. Na základě zjištěných informací implementuje vlastní metody a porovná je s existujícími přístupy. Součástí srovnání bude i vhodnost použité metody pro zobrazení dat do prostoru s malou dimenzí vhodnou pro vizualizaci.
Seznam odborné literatury
[1] Fukui, K.I., Ono, S., Megano, T. and Numao, M., 2013, November. Evolutionary distance metric learning approach to semi-supervised clustering with neighbor relations. In 2013 IEEE 25th International Conference on Tools with Artificial Intelligence (pp. 398-403). IEEE.

[2] Goldberger, J., Hinton, G.E., Roweis, S.T. and Salakhutdinov, R., 2004. Neighbourhood components analysis. In Advances in neural information processing systems (pp. 513-520).

[3] Maaten, L.V.D. and Hinton, G., 2008. Visualizing data using t-SNE. Journal of Machine Learning Research, 9(Nov), pp.2579-2605.
 
Univerzita Karlova | Informační systém UK