Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Zpětnovazební učení v multi-agentním hledání cest

Název práce v češtině:	Zpětnovazební učení v multi-agentním hledání cest
Název v anglickém jazyce:	Reinforcement Learning in Multi-agent Path Finding
Akademický rok vypsání:	2021/2022
Typ práce:	diplomová práce
Jazyk práce:	čeština
Ústav:	Katedra teoretické informatiky a matematické logiky (32-KTIML)
Vedoucí / školitel:	Mgr. Martin Pilát, Ph.D.
Řešitel:	Bc. Martin Jenč - zadáno a potvrzeno stud. odd.
Datum přihlášení:	03.06.2022
Datum zadání:	05.06.2022
Datum potvrzení stud. oddělením:	20.06.2022

Zásady pro vypracování

Problém multi-agentního hledání cest je typicky řešen pomocí plánování. Nevýhodou plánovacích přístupů ale je jejich časová náročnost a nutnost přeplánovávat v dynamických prostředích. V posledních letech se začínají rozvíjet přístupy pro multi-agentní hledání cest založené na zpětnovazbením učení. Cílem práce je zkoumat právě takové přístupy v dynamických prostředích.

Student nastuduje dostupnou literaturu týkající se využití zpětnovazebního učení v multi-agentním hledání cest. Na základě této literatury se pokusí navrhnout vlastní algoritmus pro řešení tohoto problému a porovná ho s existujícími algoritmy.

Seznam odborné literatury

[1] Sartoretti, Guillaume, Justin Kerr, Yunfei Shi, Glenn Wagner, TK Satish Kumar, Sven Koenig, and Howie Choset. "Primal: Pathfinding via reinforcement and imitation multi-agent learning." IEEE Robotics and Automation Letters 4, no. 3 (2019): 2378-2385. IEEE. DOI: 10.1109/LRA.2019.2903261
[2] Damani, Mehul, Zhiyao Luo, Emerson Wenzel, and Guillaume Sartoretti. "PRIMAL 2: Pathfinding Via Reinforcement and Imitation Multi-Agent Learning-Lifelong." IEEE Robotics and Automation Letters 6, no. 2 (2021): 2666-2673. IEEE. DOI: 10.1109/LRA.2021.3062803
[3] Lin, Bo, Bissan Ghaddar, and Jatin Nathwani. "Deep reinforcement learning for the electric vehicle routing problem with time windows." IEEE Transactions on Intelligent Transportation Systems (2021). IEEE. DOI: 10.1109/TITS.2021.3105232
[4] Li, Qingbiao, Weizhe Lin, Zhe Liu, and Amanda Prorok. "Message-aware graph attention networks for large-scale multi-robot path planning." IEEE Robotics and Automation Letters 6, no. 3 (2021): 5533-5540. IEEE. 10.1109/LRA.2021.3077863
[5] Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. 2nd ed. MIT Press, 2018. ISBN: 978-0262039246