Evolutionary Algorithms for Data Transformation
Název práce v češtině: | Transformace dat pomocí evolučních algoritmů |
---|---|
Název v anglickém jazyce: | Evolutionary Algorithms for Data Transformation |
Klíčová slova: | vzdálenostní metriky, Mahalanobisova vzdálenost, redukce dimenze, evoluční algoritmy, vizualizace, transformace dat, neuronové sítě |
Klíčová slova anglicky: | distance metric learning, Mahalanobis distance, dimensionality reduction, evolutionary algorithms, visualisation, data transformation, neural networks |
Akademický rok vypsání: | 2016/2017 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Katedra teoretické informatiky a matematické logiky (32-KTIML) |
Vedoucí / školitel: | Mgr. Martin Pilát, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 15.12.2016 |
Datum zadání: | 15.12.2016 |
Datum potvrzení stud. oddělením: | 30.12.2016 |
Datum a čas obhajoby: | 07.06.2017 10:00 |
Datum odevzdání elektronické podoby: | 15.05.2017 |
Datum odevzdání tištěné podoby: | 12.05.2017 |
Datum proběhlé obhajoby: | 07.06.2017 |
Oponenti: | Mgr. Roman Neruda, CSc. |
Zásady pro vypracování |
Transformace dat jsou důležitou součástí strojového učení, která výrazně ovlivňuje kvalitu vytvořených modelů. Transformace dat se často používají i pro jejich zobrazení do prostoru s menší dimenzí, kde se dají snáze vizualizovat. Většina metod ale funguje bez učitele a tedy není schopna najít taková zobrazení dat, která by brala v úvahu vlastnosti metod strojového učení, které následují po ní, případně se snažila vizualizaci upravit tak, aby data ze stejné třídy byla blízko u sebe. Některé metody určené přímo pro vizualizaci (jako např. t-SNE) navíc ani neposkytují transformační funkci a nejsou tedy schopny zobrazit nová data bez přepočítání celého zobrazení. Cílem práce je tedy pomocí kombinace evolučních algoritmů a dalších přístupů (např. neuronových sítí) navrhnout metody pro vytvoření transformační funkce, která bude brát v úvahu i označkování dat.
Student se seznámí s postupy pro automatické transformace dat. Na základě zjištěných informací implementuje vlastní metody a porovná je s existujícími přístupy. Součástí srovnání bude i vhodnost použité metody pro zobrazení dat do prostoru s malou dimenzí vhodnou pro vizualizaci. |
Seznam odborné literatury |
[1] Fukui, K.I., Ono, S., Megano, T. and Numao, M., 2013, November. Evolutionary distance metric learning approach to semi-supervised clustering with neighbor relations. In 2013 IEEE 25th International Conference on Tools with Artificial Intelligence (pp. 398-403). IEEE.
[2] Goldberger, J., Hinton, G.E., Roweis, S.T. and Salakhutdinov, R., 2004. Neighbourhood components analysis. In Advances in neural information processing systems (pp. 513-520). [3] Maaten, L.V.D. and Hinton, G., 2008. Visualizing data using t-SNE. Journal of Machine Learning Research, 9(Nov), pp.2579-2605. |