Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Automatická klasifikace smluv pro portál HlidacSmluv.cz
Název práce v češtině: Automatická klasifikace smluv pro portál HlidacSmluv.cz
Název v anglickém jazyce: Automated contract classification for portal HlidacSmluv.cz
Klíčová slova: e-government, strojové učenı́, transfer learning, multilabel klasifikace, klasifikace dokumentů
Klíčová slova anglicky: e-government, machine learning, transfer learning, multi-label classification, document classification
Akademický rok vypsání: 2018/2019
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. Mgr. Martin Nečaský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 28.05.2019
Datum zadání: 28.05.2019
Datum potvrzení stud. oddělením: 19.11.2019
Datum a čas obhajoby: 16.09.2020 09:00
Datum odevzdání elektronické podoby:29.07.2020
Datum odevzdání tištěné podoby:30.07.2020
Datum proběhlé obhajoby: 16.09.2020
Oponenti: RNDr. Martin Holub, Ph.D.
 
 
 
Konzultanti: doc. Mgr. Barbora Vidová Hladká, Ph.D.
Zásady pro vypracování
Hlídač smluv [1] je webový portál pro prohledávání smluv a veřejných zakázek ve veřejné správě. Data o smlouvách a jejich obsah získává z otevřených dat z Registru smluv [2]. Data o veřejných zakázkách a jejich zadávací dokumentaci získává z otevřených dat z Informačního systému o veřejných zakázkách [3]. Cílem diplomové práce je rozšířit Hlídače smluv ve spolupráci s jeho autorem o modul pro automatizovanou klasifikaci smluv a zadávací dokumentace pro výběrová řízení veřejných zakázek do kategorií, které charakterizují věcné domény klasifikovaných smluv a dokumentace (např. stavební činnost, vývoj IS, pronájem nemovité věci apod.). Seznam kategorií bude řešiteli práce dodán jako vstup. Kategorií budou řádově vyšší desítky.

V první části práce řešitel prozkoumá z pohledu klasifikace smluv a zadávací dokumentace veřejných zakázek existující přístupy pro automatizovanou klasifikaci dokumentů. Zaměří se na přístupy založené na technikách strojového učení. Na základě experimentálního ověření nad reálnými smlouvami a zadávací dokumentací vybere nejvhodnější přístup. V druhé části práce navrhne, realizuje, otestuje a zdokumentuje modul pro Hlídače smluv, ve kterém bude implementován vybraný přístup a který bude klasifikovat danou smlouvu, zadávací dokumentaci či jejich kolekci na vstupu do jedné z kategorií, případně do více kategorií s pravděpodobnostním ohodnocením klasifikace. Pro účely experimentálního ověření i implementaci klasifikačních technik v modulu je možné využít existující open-source knihovny či frameworky (např. [4,5]).
Seznam odborné literatury
[1] https://hlidacstatu.cz
[2] https://data.gov.cz/datová-sada?iri=https://data.gov.cz/zdroj/datová-sada/143188372
[3] https://data.gov.cz/datové-sady?poskytovatel=Ministerstvo%20pro%20místní%20rozvoj&klíčová%20slova=veřejné%20zakázky
[4] https://www.cs.waikato.ac.nz/ml/weka/index.html
[5] https://www.tensorflow.org
[6] Fabrizio Sebastiani. 2002. Machine learning in automated text categorization. ACM Comput. Surv. 34, 1 (March 2002), 1-47. DOI=http://dx.doi.org/10.1145/505282.505283 (dostupné z univerzitní sítě)
[7] Ian Goodfellow and Yoshua Bengio and Aaron Courville. Deep Learning. MIT Press. 2016. ISBN 9780262035613. (open access: http://www.deeplearningbook.org)
Předběžná náplň práce
Tato diplomová práce je vypsána ve spolupráci s autorem portál Hlídač smluv (hlidacsmluv.cz), který je významným zdrojem informací o smlouvách a veřejných zakázkách uzavíraných veřejnými institucemi v České republice. Portál má vysokou návštěvnost a je často zmiňován v médiích v souvislosti s transparentností a efektivitou veřejné správy a s oblastí eGovernmentu (viz např. článek na Lupa.cz [1]). Pokud si tuto práci vyberete, získáte možnost spolupracovat na zajímavém a společensky velmi přínosném projektu a pokud uspějete, vaše práce bude vidět!

[1] https://www.lupa.cz/clanky/michal-blaha-hlidacstatu-cz-novinari-kteri-pouzivaji-hlidace-maji-nejvic-exkluzivnich-zprav/
 
Univerzita Karlova | Informační systém UK