Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Evolutionary Algorithms for Data Transformation

Název práce v češtině:	Transformace dat pomocí evolučních algoritmů
Název v anglickém jazyce:	Evolutionary Algorithms for Data Transformation
Klíčová slova:	vzdálenostní metriky, Mahalanobisova vzdálenost, redukce dimenze, evoluční algoritmy, vizualizace, transformace dat, neuronové sítě
Klíčová slova anglicky:	distance metric learning, Mahalanobis distance, dimensionality reduction, evolutionary algorithms, visualisation, data transformation, neural networks
Akademický rok vypsání:	2016/2017
Typ práce:	diplomová práce
Jazyk práce:	angličtina
Ústav:	Katedra teoretické informatiky a matematické logiky (32-KTIML)
Vedoucí / školitel:	Mgr. Martin Pilát, Ph.D.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	15.12.2016
Datum zadání:	15.12.2016
Datum potvrzení stud. oddělením:	30.12.2016
Datum a čas obhajoby:	07.06.2017 10:00
Datum odevzdání elektronické podoby:	15.05.2017
Datum odevzdání tištěné podoby:	12.05.2017
Datum proběhlé obhajoby:	07.06.2017
Oponenti:	Mgr. Roman Neruda, CSc.

Zásady pro vypracování

Transformace dat jsou důležitou součástí strojového učení, která výrazně ovlivňuje kvalitu vytvořených modelů. Transformace dat se často používají i pro jejich zobrazení do prostoru s menší dimenzí, kde se dají snáze vizualizovat. Většina metod ale funguje bez učitele a tedy není schopna najít taková zobrazení dat, která by brala v úvahu vlastnosti metod strojového učení, které následují po ní, případně se snažila vizualizaci upravit tak, aby data ze stejné třídy byla blízko u sebe. Některé metody určené přímo pro vizualizaci (jako např. t-SNE) navíc ani neposkytují transformační funkci a nejsou tedy schopny zobrazit nová data bez přepočítání celého zobrazení. Cílem práce je tedy pomocí kombinace evolučních algoritmů a dalších přístupů (např. neuronových sítí) navrhnout metody pro vytvoření transformační funkce, která bude brát v úvahu i označkování dat.

Student se seznámí s postupy pro automatické transformace dat. Na základě zjištěných informací implementuje vlastní metody a porovná je s existujícími přístupy. Součástí srovnání bude i vhodnost použité metody pro zobrazení dat do prostoru s malou dimenzí vhodnou pro vizualizaci.

Seznam odborné literatury

[1] Fukui, K.I., Ono, S., Megano, T. and Numao, M., 2013, November. Evolutionary distance metric learning approach to semi-supervised clustering with neighbor relations. In 2013 IEEE 25th International Conference on Tools with Artificial Intelligence (pp. 398-403). IEEE.

[2] Goldberger, J., Hinton, G.E., Roweis, S.T. and Salakhutdinov, R., 2004. Neighbourhood components analysis. In Advances in neural information processing systems (pp. 513-520).

[3] Maaten, L.V.D. and Hinton, G., 2008. Visualizing data using t-SNE. Journal of Machine Learning Research, 9(Nov), pp.2579-2605.