Počítačové zpracování dat se stalo metodologickým předpokladem velké většiny vědních oborů, včetně humanitních a
společenskovědních. Výuka probíhá formou názorných příkladů a vede studenty od úplných základů práce s daty k
řešení praktických úloh pomocí nástrojů implementovaných v softwarovém prostředí R. Tento kurz nepředpokládá žádné
předchozí znalosti programování a je určen především studentům humanitních a společenskovědních oborů, a to na
jakémkoliv stupni (Bc/Mgr/PhD).
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (24.05.2023)
Computer data processing has become a methodological prerequisite for the vast majority of scientific fields, including
the humanities and social sciences. The teaching takes place in the form of illustrative examples and guides students
from the very basics of working with data to solving practical problems using tools implemented in the R software
environment. This course does not assume any previous knowledge of programming and is intended primarily for
students of humanities and social sciences, at any level (Bc/Mgr/PhD).
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (24.05.2023)
Cíl předmětu -
Studenti se naučí samostatně využívat systém R ke zpracování a analýze dat z oblasti humanitních a společenských věd. Kurz poskytuje systematickou technickou podporu pro zvládnutí základů umělé inteligence v rámci navazujícího předmětu "Umělá inteligence pro humanitní a společenské vědy" [NPFL 142].
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (24.05.2023)
Students will learn to independently use the R system to process and analyze data from the humanities and social sciences. The course provides systematic technical support for mastering the basics of artificial intelligence within the follow-up course "Artificial Intelligence for the Humanities" [NPFL 142].
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (24.05.2023)
Podmínky zakončení předmětu -
Předmět bude ukončen písemným zápočtovým testem. Docházka na cvičení je povinná. Zápočet se uděluje za aktivní práci během celého semestru a odevzdávání průběžných domácích úkolů.
Poslední úprava: Holub Martin, RNDr., Ph.D. (06.06.2023)
The course will end with a written credit test. Attendance at practice is mandatory. Credit is awarded for active work throughout the semester and submission of ongoing homework.
Poslední úprava: Mírovský Jiří, RNDr., Ph.D. (24.05.2023)
Literatura -
Grolemund, Garrett and Hadley Wickham: R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media, 2016. [https://r4ds.hadley.nz/]
Gonick, Larry and Woollcott Smith. The Cartoon Guide to Statistics. Harper Resource. 2005.
Arnold, Taylor and Lauren Tilton: Humanities Data in R. Exploring Networks, Geospatial Data, Images, and Text. Springer, 2015. [https://link.springer.com/book/10.1007/978-3-319-20702-5]
Poslední úprava: Holub Martin, RNDr., Ph.D. (06.06.2023)
Grolemund, Garrett and Hadley Wickham: R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media, 2016. [https://r4ds.hadley.nz/]
Gonick, Larry and Woollcott Smith. The Cartoon Guide to Statistics. Harper Resource. 2005.
Arnold, Taylor and Lauren Tilton: Humanities Data in R. Exploring Networks, Geospatial Data, Images, and Text. Springer, 2015. [https://link.springer.com/book/10.1007/978-3-319-20702-5]
Poslední úprava: Holub Martin, RNDr., Ph.D. (06.06.2023)
Sylabus -
Základy používání systému R, elementární programovací dovednosti
Datové vektory, datové tabulky, ukládání do souborů
Textová data a jejich zpracování
Nástroje z balíčku tidyverse
Vizualizace dat
Regulární výrazy
Elementární znalosti z pravděpodobnosti a statistiky
Teoretické a empirické pravděpodobnostní rozdělení
Kontingenční tabulky
Simulace náhodných procesů
Binomické a normální rozdělení
Používání jednoduchých statistických testů
Podpora pro experimentování s umělou inteligencí
Poslední úprava: Holub Martin, RNDr., Ph.D. (06.06.2023)
Basics of using the R system, elementary programming skills
Data vectors, data tables, working with data files
Methods for textual data processing
Tools from the tidyverse package
Data visualization
Regular expressions
Elementary knowledge of probability and statistics
Theoretical and empirical probability distribution
Contingency tables
Simulation of random processes
Binomial and normal distributions
Using simple statistical tests
Support for experimenting with Artificial Intelligence
Poslední úprava: Holub Martin, RNDr., Ph.D. (06.06.2023)