Doporučovací systémy pro řídká data
Název práce v češtině: | Doporučovací systémy pro řídká data |
---|---|
Název v anglickém jazyce: | Recommender Systems for Sparse Datasets |
Klíčová slova: | Doporučovací systémy, uživatelské preference, data sparsity, strojové učení |
Klíčová slova anglicky: | Recommender systems, user preferences, data sparsity, machine learning |
Akademický rok vypsání: | 2018/2019 |
Typ práce: | diplomová práce |
Jazyk práce: | |
Ústav: | Katedra softwarového inženýrství (32-KSI) |
Vedoucí / školitel: | Mgr. Ladislav Peška, Ph.D. |
Řešitel: |
Zásady pro vypracování |
Řešitel nejprve získá přehled v oblasti učení uživatelských preferencí a doporučovacích systémů, zaměří se především na skupiny collaborative, content-based a non-personalized doporučovacích algoritmů, metody pro získávání explicitní a implicitní zpětné vazby, jejich výhody, nevýhody a možnosti použití.
Řešitel na základě prostudované literatury vybere/navrhne/upraví vhodné doporučovací algoritmy a datasety, navrhne a implementuje SW pro jejich testování a provede experimenty. V implementační části bude kladen důraz především na modularitu, rozšiřitelnost a konfigurovatelnost systému. Vhodné je integrovat již existující frameworky / knihovny doporučovacích algoritmů. V experimentech bude kladen důraz především na validitu, opakovatelnost experimentů, zaměření na různé varianty „řídkosti“ dat, identifikování klíčových faktorů ovlivňujících jednotlivé algoritmy a srovnání s existující literaturou. Téma je z dynamicky se vyvíjející domény a předpokládá kontinuální kontakt (zadání diplomové práce se bude průběžně upřesňovat). Nedílnou součástí práce je sběr dat, implementace v definovaném prostředí a experiment. |
Seznam odborné literatury |
Ricci, F. et al (Eds): Recommender Systems Handbook, Springer, 2011
Jannach, D. et al (Eds): Recommender Systems: An Introduction, Cambridge University Press, 2011 Forbes, P. & Zhu, M. Content-boosted matrix factorization for recommender systems: experiments with recipe recommendation Proceedings of the fifth ACM conference on Recommender systems, ACM, 2011, 261-264 Koren, Y.; Bell, R. & Volinsky, C. Matrix Factorization Techniques for Recommender Systems Computer, IEEE Computer Society Press, 2009, 42, 30-37 Eckhardt, A. Similarity of users (content-based) preference models for Collaborative filtering in few ratings scenario Expert Systems with Applications, 2012, 39, 11511 - 11516 Kluver, D. & Konstan, J. A. Evaluating Recommender Behavior for New Users. Proceedings of the 8th ACM Conference on Recommender Systems, ACM, 2014, 121-128 Claypool, M.; Le, P.; Wased, M. & Brown, D. Implicit interest indicators Proceedings of the 6th international conference on Intelligent user interfaces, ACM, 2001, 33-40 Marius Kaminskas, Derek Bridge, Franclin Foping and Donogh Roche: Product-Seeded and Basket-Seeded Recommendations for Small-Scale Retailers, Journal on Data Semantics, pp.1-12, 2016. Steffen Rendle, Christoph Freudenthaler, Zeno Gantner, and Lars Schmidt-Thieme. BPR: Bayesian personalized ranking from implicit feedback. In UAI '09. AUAI Press, 2009, 452-461. Noam Koenigstein and Yehuda Koren: Towards scalable and accurate item-oriented recommendations. In RecSys '13, ACM, 2013 |
Předběžná náplň práce |
Doporučovací systémy (doporučování objektů uživateli na základě jeho předchozích akcí) získaly v poslední dekádě velkou pozornost jak ve vědecké komunitě, tak i v komerčním prostředí. V současné literatuře jsou zmiňovány především algoritmy založené na kolaborativním filtrování (podobnost mezi uživateli), které jsou maximálně účinné v „hustých“ datasetech, kde je pro každého uživatele k dispozici dostatek dat a celkově existuje dostatečné množství uživatelů.
Tento ideální stav však v praxi často nebývá dosažen – obecně mluvíme o „cold-start“ problému. Řada webových projektů (např. menší e-commerce portály) má pouze omezenou cílovou skupinu, návštěvy na některých doménách bývají příliš krátké k vytvoření dostatečného množství zpětné vazby… I na jinak „hustých“ doménách je problémem doporučování pro nového uživatele, nebo nového objektu. Cílem práce je zaměřit se na různé skupiny doporučovacích algoritmů a zjistit, jak se chovají ve zmíněných „krajních“ situacích, výsledky pak porovnat s dostupnou literaturou. Práce je svým charakterem především vědecká, částečně implementační. Dosažené výsledky by měly být publikovatelné na mezinárodních konferencích. |
Předběžná náplň práce v anglickém jazyce |
Recommender systems gained serious attention recently both in research and industry. State-of-the-art literature is predominantly focused on collaborative-filtering algorithms (based on the similarity of user's behavioral patterns), which works best on "dense" datasets with large-enough user base and enough feedback from them.
Such "dense" datasets are, unfortunately, not very common in the real life. Many web portals such as small e-commerce have only a limited target-group of users, who often do not provide much feedback resulting into a permanent cold-start problem. Even in case of otherwise dense datasets, there are two specific challenges: recommending for new user and new object. The aim of the thesis is to focus on different groups of recommending algorithms and test them in these "borderline" cases. The thesis is mostly research-based and partially implementational - the results (if interesting) could be published in scientific conferences/journals. |