Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Zpětnovazební učení v multi-agentním hledání cest
Název práce v češtině: Zpětnovazební učení v multi-agentním hledání cest
Název v anglickém jazyce: Reinforcement Learning in Multi-agent Path Finding
Akademický rok vypsání: 2021/2022
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra teoretické informatiky a matematické logiky (32-KTIML)
Vedoucí / školitel: Mgr. Martin Pilát, Ph.D.
Řešitel: Bc. Martin Jenč - zadáno a potvrzeno stud. odd.
Datum přihlášení: 03.06.2022
Datum zadání: 05.06.2022
Datum potvrzení stud. oddělením: 20.06.2022
Zásady pro vypracování
Problém multi-agentního hledání cest je typicky řešen pomocí plánování. Nevýhodou plánovacích přístupů ale je jejich časová náročnost a nutnost přeplánovávat v dynamických prostředích. V posledních letech se začínají rozvíjet přístupy pro multi-agentní hledání cest založené na zpětnovazbením učení. Cílem práce je zkoumat právě takové přístupy v dynamických prostředích.

Student nastuduje dostupnou literaturu týkající se využití zpětnovazebního učení v multi-agentním hledání cest. Na základě této literatury se pokusí navrhnout vlastní algoritmus pro řešení tohoto problému a porovná ho s existujícími algoritmy.
Seznam odborné literatury
[1] Sartoretti, Guillaume, Justin Kerr, Yunfei Shi, Glenn Wagner, TK Satish Kumar, Sven Koenig, and Howie Choset. "Primal: Pathfinding via reinforcement and imitation multi-agent learning." IEEE Robotics and Automation Letters 4, no. 3 (2019): 2378-2385. IEEE. DOI: 10.1109/LRA.2019.2903261
[2] Damani, Mehul, Zhiyao Luo, Emerson Wenzel, and Guillaume Sartoretti. "PRIMAL 2: Pathfinding Via Reinforcement and Imitation Multi-Agent Learning-Lifelong." IEEE Robotics and Automation Letters 6, no. 2 (2021): 2666-2673. IEEE. DOI: 10.1109/LRA.2021.3062803
[3] Lin, Bo, Bissan Ghaddar, and Jatin Nathwani. "Deep reinforcement learning for the electric vehicle routing problem with time windows." IEEE Transactions on Intelligent Transportation Systems (2021). IEEE. DOI: 10.1109/TITS.2021.3105232
[4] Li, Qingbiao, Weizhe Lin, Zhe Liu, and Amanda Prorok. "Message-aware graph attention networks for large-scale multi-robot path planning." IEEE Robotics and Automation Letters 6, no. 3 (2021): 5533-5540. IEEE. 10.1109/LRA.2021.3077863
[5] Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. 2nd ed. MIT Press, 2018. ISBN: 978-0262039246
 
Univerzita Karlova | Informační systém UK