Last update: doc. Mgr. Milan Krtička, Ph.D. (20.09.2019)
The aim of the course is to introduce basic statistical methods frequently used in analysis of experimental data in
high energy physics. We focus mainly on practical aspects and application of the methods covered in the course.
For each topic an example code will be provided based on ROOT, RooFit, and RooStat and HistFitter tools.
Last update: doc. Mgr. Milan Krtička, Ph.D. (20.09.2019)
Cílem přednášky je seznámit studenty se základními statistickými metodami používanými při analýze dat
experimentů ve fyzice vysokých energií. Důraz je kladen na praktickou stránku a aplikace probraných metod. Ke
každému tématu dostanou studenti k dispozici ukázkový kód založený na nástrojích ROOT, RooFit, RooStats a
HistFitter.
Course completion requirements -
Last update: doc. Mgr. Milan Krtička, Ph.D. (20.09.2019)
Final grade will be based on a combination of the written exam and homework.
Last update: doc. Mgr. Milan Krtička, Ph.D. (20.09.2019)
Známka bude udělena na základě písemné zkoušky a domácích úkolů.
Syllabus -
Last update: doc. Mgr. Milan Krtička, Ph.D. (06.10.2020)
Brief introduction to mathematical statistics: probability, probability density function, cumulative probability function, moments, MC method, error propagation, correlation, examples of common probability density functions
Parameter estimation: Classical definition of interval estimates, example for normal and binomial distribution. Maximum likelihood method: definition, variance of M.L. estimates (analytical method, MC method, RCF bound, graphical method), multi-parameter estimates, likelihood contours and their interpretation, binned M.L. method, relation with the least square method, M.L. for weighted data, extended likelihood, constrained likelihood, profile likelihood
Statistical tests: hypothesis, test statistics, confidence level, profile likelihood test, discovery and limit setting for new physics models, p a p0 values, significance, CLs method. Goodness of fit test.
Multivariate techniques for signal and background separation: Fisher discriminant, non-linear discriminants (neural networks, boosted decision trees, ...).
Unfolding: impact of a detector resolution on data, migration matrix, migration matrix inversion and problems of this method, regularisation, variance and bias of the unfolded distributions, unfolding techniques
More details on http://ipnp.cz/?page_id=4280.
Last update: doc. Mgr. Milan Krtička, Ph.D. (06.10.2020)
Stručný úvod do matematické statistiky: pravděpodobnost, hustota pravděpodobnosti, kumulativní hustota pravděpodobnosti, momenty, MC metoda, propagace chyb, korelace, příklady rozdělení pravděpodobnosti.
Odhad parametrů: Klasická teorie intervalů spolehlivosti. Příklad pro normální a binomické rozdělení. Metoda maximální věrohodnosti (maximum likelihood): definice, variance M.L. odhadů (analytická metoda, MC metoda, applikace RCF nerovnosti, grafická metoda), případ pro více parametrů, M.L. kontury a jejich interpretace, M.L. metoda pro binovaná data, souvislost s metodou nejmenších čtverců, M.L. pro váhovaná data, extended likelihood, constrained likelihood, profile likelihood.
Statistické testy: hypotéza, testovací statistika, úroveň spolehlivosti, test podílu profilovaných věrohodností, objevy nových částic, odhad limitů fyzikálních modelů, p a p0 hodnota, signifikance, CLs metoda. Testování kvality fitu.
Multivarietní metody diskriminace signálu a pozadí: Fisherův diskriminant, nelineární diskriminant (neuronové sítě, boosted decision tree, ...).
Dekonvoluce (unfolding): efekty detektorového rozlišení na data, migrační matice, inverze migrační matice a problémy této metody, regularizační metody, variance a bias dekonvoluovaných rozdělení, dekonvoluční techniky.
Detailní informace o průběhu přednášky na http://ipnp.cz/?page_id=4280.