SubjectsSubjects(version: 964)
Course, academic year 2024/2025
   Login via CAS
Data science in R - B90287
Title: Data science v R
Guaranteed by: Institute of Pathological Physiology First Faculty of Medicine Charles University (11-00180)
Faculty: First Faculty of Medicine
Actual: from 2024
Semester: both
Points: 0
E-Credits: 0
Hours per week, examination: 10/0, C [HS]
Capacity: unlimited
Min. number of students: unlimited
4EU+: no
Virtual mobility / capacity: no
State of the course: taught
Language: Czech
Teaching methods: combined
Note: course is intended for doctoral students only
course can be enrolled in outside the study plan
you can enroll for the course in winter and in summer semester
Guarantor: doc. MUDr. Petr Waldauf, Ph.D.
prof. RNDr. Jan Hendl, CSc.
Annotation - Czech
Kurz má naučit uchazeče základní práci se statistickým programem R v grafickém prostředí RStudio. Cílem je získání základních zkušeností a praktických dovedností s rychlým a efektivním zpracováním klinických dat prostřednictvím kolekce balíků tidyverse. V kurzu se budeme zabývat úvodem do statistického zpracování dat v R (deskriptivní statistika, pokročilejší grafická zobrazení dat, základní statistické testy, úvod do multivariantní analýzy). Od uchazečů není vyžadována přechozí zkušenost s programovacím jazykem R. Výuka bude probíhat praktickou formou přímo v RStudiu, které si uchazeč nainstaluje na svůj počítač. Budou připraveny výukové skripty a data sety. NUTNÉ MÍT K DISPOZICI VLASTNÍ NOTEBOOK. Přednášená témata zahrnují například: • Úvod do R K čemu datascience, přehled software pro datascience, literatura pro studium, DataCamp, cheatsheets, úvod do R a RStudio, instalace R a RStudio, první příkazy v R • Jak načíst a třídit svoje data: úvod do tidyverse Proč Tidyverse, import dat do R (csv, xlsx) – reader, glimpse, úvod do data wrangling – pipeline, dplyr (select, filter, mutate, arrange, rename, group_by, summarise) • Obrázky do článku i posteru: úvod do vizualizace ggplot (scatter plot, bar plot, box plot, histogram, facets, geom_smooth) • Publikace přímo z RStudio: Úvod do markdown proč markdown, reproducible research, pandoc, html, ms word, pdf • Práce s faktory, strings s datumem a časem factor, forcats, stringer, lubridate • Úvod do funkcí • Relační data wide + long formát dat, co jsou to relační data, jak jsou ukládána data v databázích, left_join, right_join, full_join, anti_join, wide, • Úvod do statistického zpracování dat deskriptivní statistika (gtsummary), t test (párový, nepárový), neparametrické testy, kategorická data, chi-square test, Fisher test, linearní regrese, logistická regrese, time-to-event analýza, multivariantní lineární, logistická a Cox regrese.
Last update: Machová Marie, Bc., DiS. (08.04.2024)
Literature - Czech

Povinná:

  • Wickham, Hadley Grolemund, Garrett. R for data science : import, tidy, transform, visualize and model data. Beijing ; Boston ; Farnham ; Sebastopol ; Tokyo: O'Reilly Media, 2016, 492 s. ISBN 978-1-491-91039-9.
  • Biostatistics With 'R': A Guide for Medical Doctors [online]. Dostupné z: https://www.bigbookofr.com/

Last update: Machová Marie, Bc., DiS. (08.04.2024)
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html