Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Hledání nových drug-target interakcí pomocí faktorizace matic
Název práce v češtině: Hledání nových drug-target interakcí pomocí faktorizace matic
Název v anglickém jazyce: Predicting novel drug-target interactions via matrix factorization techniques
Klíčová slova: drug-target interactions, faktorizace matic, stochastic gradient descend, altering least squares
Klíčová slova anglicky: drug-target interactions, matrix factorization, stochastic gradient descend, altering least squares
Akademický rok vypsání: 2019/2020
Typ práce: diplomová práce
Jazyk práce:
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: Mgr. Ladislav Peška, Ph.D.
Řešitel:
Zásady pro vypracování
Řešitel nejprve získá přehled v oblasti drug repositioning ([1-7]), zaměří se především na použité metody, datasety a způsob evaluace. Dále získá přehled v existujících metodách faktorizace matic používaných v doporučovacích systémech [8-11] a jejich možných rozšířeních.

Na základě prostudované literatury řešitel vybere / navrhne / upraví vhodné algoritmy, navrhne a implementuje SW pro jejich testování a provede experimenty na zvolených datasetech.
V zásadě jsou možné dva přístupy:
- navržení / úprava a implementace metody, která prozatím nebyla použita pro drug repositioning a její evaluace.
- komplexní evaluace vícero existujících metod (případně jejich jednoduchých rozšíření). Zde je možné např. definovat relevantnější cílové metriky, nebo evaluační protokol ([4]).

Téma je z dynamicky se vyvíjející domény a předpokládá kontinuální kontakt (zadání diplomové práce se bude průběžně upřesňovat). Nedílnou součástí práce je však sběr dat, implementace v definovaném prostředí a experiment.
Seznam odborné literatury
[1] Bleakley K, Yamanishi Y. Supervised prediction of drug–target interactions using bipartite local models. Bioinformatics. 2009; 25(18):2397-2403.
[2] Cheng, A.C, Coleman, R.G, Smyth, K.T, et al. Structure-based maximal affinity model predicts small-molecule druggability. Nature Biotechnology. 2007; 25 (1):71-75.
[3] van Laarhoven T, Nabuurs S. B, Marchiori E. Gaussian interaction profile kernels for predicting drug–target interaction. Bioinformatics. 2011, 27, 3036-3043
[4] Pahikkala T, Airola A, Pietilä S, et al. Toward more realistic drug–target interaction predictions. Briefings in Bioinformatics. 2015; 16(2):325-337.
[5] Liu Y, Wu M, Miao C, Zhao P, Li XL (2016) Neighborhood Regularized Logistic Matrix Factorization for Drug-Target Interaction Prediction. PLoS Comput Biol 12(2): e1004760. doi: 10.1371/journal.pcbi.1004760
[6] Gönen M. Predicting drug–target interactions from chemical and genomic kernels using Bayesian matrix factorization. Bioinformatics. 2012;28(18):2304–2310. doi: 10.1093/bioinformatics/bts360.
[7] Zheng X, Ding H, Mamitsuka H, Zhu S. Collaborative matrix factorization with multiple similarities for predicting drug-target interactions. KDD’13: Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2013

[8] Nguyen J, Zhu M. Content-boosted matrix factorization techniques for recommender systems. Statistical Analysis and Data Mining, Wiley Subscription Services. 2013; 6, 286-301
[9] Rendle, S, Freudenthaler, C, Gantner Z, et al. BPR: Bayesian Personalized Ranking from Implicit Feedback. Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence, AUAI Press, 2009, 452-461.
[10] Ricci, F. et al (Eds): Recommender Systems Handbook, Springer, 2011
[11] Jannach, D. et al (Eds): Recommender Systems: An Introduction, Cambridge University Press, 2011
Předběžná náplň práce
"In silico" predikce interakcí mezi léčivy (drugs) a proteiny (targets) patří k zajímavým a v poslední době intenzivně zkoumaným aplikacím strojového učení. Motivace pochází z farmaceutického průmyslu, kde zavádění nových léčiv do oběhu je jak časově, tak i finančně velmi náročné. To vede k hledání nového využití pro již existující léčiva (tzv. drug repositioning), které může být v případě úspěchu mnohem levnější a rychlejší.

Jeden z přístupů k řešení problému "drug repositioning" je využít metod strojového učení, například různých variant faktorizace matic (viz. seznam literatury). Vzhledem k podobnosti na úrovni dat i hypotéz je tento problém blízce příbuzný s doporučovacími systémy a tím pádem je možno použít stejné či modifikované algoritmy. I když byla tato oblast již poměrně intenzivně zkoumána, stále zde zůstává prostor pro návrh / upravu metod založených na faktorizaci matic, případně pro komplexní porovnání již existujících metod.
Předběžná náplň práce v anglickém jazyce
"In silico" prediction of drug-target interactions is an interesting and intensively studied application of machine learning. The motivation comes from the pharmaceutic industry, where developing novel drugs is extremely costly and time-consuming process. This led to focusing also on searching for novel usage of existing or abandoned drugs (i.e. drug repositioning), which might be much less demaning in terms of both money and time.

One possible approach to the drug repositioning problem is to use some machine learning methods, e.g. some variant of drug-target matrix factorization. Due to the similarity on both data and hypothesis level, this problem is highly similar with the recommender systems and thus, similar algorithms can be used. Although this area was already quite extensively studied, there is still space for proposing novel/altered methods based on matrix factoization as well as for some more complex comparison of the existing ones.
 
Univerzita Karlova | Informační systém UK