PředmětyPředměty(verze: 964)
Předmět, akademický rok 2024/2025
   Přihlásit přes CAS
Zpracování přirozeného jazyka na výpočetním clusteru - NPFL118
Anglický název: Natural language processing on computational cluster
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2022
Semestr: zimní
E-Kredity: 3
Rozsah, examinace: zimní s.:0/2, Z [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: http://ufal.mff.cuni.cz/courses/npfl118
Garant: RNDr. Milan Straka, Ph.D.
Mgr. Martin Popel, Ph.D.
Mgr. Rudolf Rosa, Ph.D.
Vyučující: Mgr. Martin Popel, Ph.D.
Mgr. Rudolf Rosa, Ph.D.
RNDr. Milan Straka, Ph.D.
Anotace -
Cílem předmětu je seznámit studenty s postupy potřebnými při zpracování přirozeného jazyka (zpracování velkých dat v distribuovaném prostředí a strojové učení) a předvést, jak je efektivně provádět v prostředí linuxového výpočetního clusteru Ústavu formální a aplikované lingvistiky (ÚFAL). Kurz bude věnován síťové architektuře a architektuře clusteru, SGE (Sun/Oracle/Son of Grid Engine), souvisejícím linuxových nástrojům a zavedeným postupům. Celý předmět bude odučen v několika prvních týdnech semestru.
Poslední úprava: T_UFAL (04.05.2017)
Podmínky zakončení předmětu -

Vypracování zadaných úkolů a aktivní účast na semináři.

Pro smysluplnou účast na kurzu a možnost splnění úkolů je nutné mít přístup na výpočetní cluster ÚFAL, kurz je proto velmi vhodný pro doktorské studenty ÚFAL, pro jiné studenty je naopak, až na výjimečné případy, nevhodný.

Poslední úprava: Rosa Rudolf, Mgr., Ph.D. (26.09.2022)
Literatura -

Data-Intensive Text Processing with MapReduce; Jimmy Lin and Chris Dyer.; Morgan & Claypool Publishers, 2010

Slurm - https://slurm.schedmd.com/

Apache Spark - https://spark.apache.org/

TensorFlow - https://www.tensorflow.org/

Poslední úprava: Popel Martin, Mgr., Ph.D. (01.10.2022)
Sylabus -

Technologické problémy při zpracování velkého objemu dat

Síťová architektura a architektura clusteru Ústavu formální a aplikované lingvistiky (ÚFAL)

Slurm - architektura, příkazy

Poslední úprava: Popel Martin, Mgr., Ph.D. (01.10.2022)
 
Univerzita Karlova | Informační systém UK