Generating text from structured data
Název práce v češtině: | Generování textu ze strukturovaných dat |
---|---|
Název v anglickém jazyce: | Generating text from structured data |
Klíčová slova: | generování textu|strukturovaná data|zpracování přirozeného jazyka|neuronové sítě |
Klíčová slova anglicky: | text generation|structured data|natural language processing|neural networks |
Akademický rok vypsání: | 2020/2021 |
Typ práce: | bakalářská práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | Mgr. Rudolf Rosa, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 22.12.2020 |
Datum zadání: | 24.03.2021 |
Datum potvrzení stud. oddělením: | 12.04.2021 |
Datum a čas obhajoby: | 02.07.2021 09:00 |
Datum odevzdání elektronické podoby: | 27.05.2021 |
Datum odevzdání tištěné podoby: | 27.05.2021 |
Datum proběhlé obhajoby: | 02.07.2021 |
Oponenti: | Ing. Zdeněk Kasner, Ph.D. |
Zásady pro vypracování |
Cílem práce je prozkoumat možnosti transformace strukturovaných tabulkových dat do přirozeného jazyka.
Úlohou je vytvoření modelu, jehož vstupem jsou strukturovaná data o sportovním zápase, a výstupem je textový popis zápasu v přirozeném jazyce, popisující například jednotlivé momenty zápasu a/nebo shrnující průběh celého zápasu. Předpokládá se využití vhodných state-of-the-art metod založených na umělých neuronových sítích, nejspíše LSTM či GRU s mechanismem attention nebo Transformer. |
Seznam odborné literatury |
CHEN, Zhiyu, et al. Few-shot nlg with pre-trained language model. ACL 2020.
https://www.aclweb.org/anthology/2020.acl-main.18.pdf WISEMAN, Sam; SHIEBER, Stuart M.; RUSH, Alexander M. Challenges in data-to-document generation. EMNLP 2017. https://www.aclweb.org/anthology/D17-1239.pdf LEBRET, Rémi; GRANGIER, David; AULI, Michael. Neural text generation from structured data with application to the biography domain. arXiv preprint arXiv:1603.07771, 2016. https://github.com/DavidGrangier/wikipedia-biography-dataset |