Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Generating text from structured data
Název práce v češtině: Generování textu ze strukturovaných dat
Název v anglickém jazyce: Generating text from structured data
Klíčová slova: generování textu|strukturovaná data|zpracování přirozeného jazyka|neuronové sítě
Klíčová slova anglicky: text generation|structured data|natural language processing|neural networks
Akademický rok vypsání: 2020/2021
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Rudolf Rosa, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 22.12.2020
Datum zadání: 24.03.2021
Datum potvrzení stud. oddělením: 12.04.2021
Datum a čas obhajoby: 02.07.2021 09:00
Datum odevzdání elektronické podoby:27.05.2021
Datum odevzdání tištěné podoby:27.05.2021
Datum proběhlé obhajoby: 02.07.2021
Oponenti: Ing. Zdeněk Kasner, Ph.D.
 
 
 
Zásady pro vypracování
Cílem práce je prozkoumat možnosti transformace strukturovaných tabulkových dat do přirozeného jazyka.

Úlohou je vytvoření modelu, jehož vstupem jsou strukturovaná data o sportovním zápase, a výstupem je textový popis zápasu v přirozeném jazyce, popisující například jednotlivé momenty zápasu a/nebo shrnující průběh celého zápasu.

Předpokládá se využití vhodných state-of-the-art metod založených na umělých neuronových sítích, nejspíše LSTM či GRU s mechanismem attention nebo Transformer.
Seznam odborné literatury
CHEN, Zhiyu, et al. Few-shot nlg with pre-trained language model. ACL 2020.
https://www.aclweb.org/anthology/2020.acl-main.18.pdf

WISEMAN, Sam; SHIEBER, Stuart M.; RUSH, Alexander M. Challenges in data-to-document generation. EMNLP 2017.
https://www.aclweb.org/anthology/D17-1239.pdf

LEBRET, Rémi; GRANGIER, David; AULI, Michael. Neural text generation from structured data with application to the biography domain. arXiv preprint arXiv:1603.07771, 2016.
https://github.com/DavidGrangier/wikipedia-biography-dataset
 
Univerzita Karlova | Informační systém UK