course is intended for doctoral students only course can be enrolled in outside the study plan you can enroll for the course in winter and in summer semester
Kurz má naučit uchazeče základní práci se statistickým programem R v grafickém prostředí RStudio. Cílem je
získání základních zkušeností a praktických dovedností s rychlým a efektivním zpracováním klinických dat
prostřednictvím kolekce balíků tidyverse. V kurzu se budeme zabývat úvodem do statistického zpracování dat v R
(deskriptivní statistika, pokročilejší grafická zobrazení dat, základní statistické testy, úvod do multivariantní analýzy).
Od uchazečů není vyžadována přechozí zkušenost s programovacím jazykem R. Výuka bude probíhat praktickou
formou přímo v RStudiu, které si uchazeč nainstaluje na svůj počítač. Budou připraveny výukové skripty a data sety.
NUTNÉ MÍT K DISPOZICI VLASTNÍ NOTEBOOK.
Přednášená témata zahrnují například:
• Úvod do R
K čemu datascience, přehled software pro datascience, literatura pro studium, DataCamp, cheatsheets, úvod do
R a RStudio, instalace R a RStudio, první příkazy v R
• Jak načíst a třídit svoje data: úvod do tidyverse
Proč Tidyverse, import dat do R (csv, xlsx) – reader, glimpse, úvod do data wrangling – pipeline, dplyr (select, filter,
mutate, arrange, rename, group_by, summarise)
• Obrázky do článku i posteru: úvod do vizualizace
ggplot (scatter plot, bar plot, box plot, histogram, facets, geom_smooth)
• Publikace přímo z RStudio: Úvod do markdown
proč markdown, reproducible research, pandoc, html, ms word, pdf
• Práce s faktory, strings s datumem a časem
factor, forcats, stringer, lubridate
• Úvod do funkcí
• Relační data
wide + long formát dat, co jsou to relační data, jak jsou ukládána data v databázích, left_join, right_join, full_join,
anti_join, wide,
• Úvod do statistického zpracování dat
deskriptivní statistika (gtsummary), t test (párový, nepárový), neparametrické testy, kategorická data, chi-square
test, Fisher test, linearní regrese, logistická regrese, time-to-event analýza, multivariantní lineární, logistická a Cox
regrese.
Last update: Machová Marie, Bc., DiS. (08.04.2024)
Literature - Czech
Povinná:
Wickham, Hadley Grolemund, Garrett. R for data science : import, tidy, transform, visualize and model data. Beijing ; Boston ; Farnham ; Sebastopol ; Tokyo: O'Reilly Media, 2016, 492 s. ISBN 978-1-491-91039-9.