SubjectsSubjects(version: 964)
Course, academic year 2024/2025
   Login via CAS
Data Processing in Geology - MS710P15
Title: Zpracování dat v geologii
Czech title: Zpracování dat v geologii
Guaranteed by: Institute of Applied Mathematics and Information Technologies (31-710)
Faculty: Faculty of Science
Actual: from 2024
Semester: summer
E-Credits: 5
Examination process: summer s.:
Hours per week, examination: summer s.:2/2, C+Ex [HT]
Capacity: unlimited
Min. number of students: unlimited
4EU+: no
Virtual mobility / capacity: no
State of the course: taught
Language: Czech
Note: enabled for web enrollment
priority enrollment if the course is part of the study plan
Guarantor: prof. RNDr. Josef Ježek, CSc.
Teacher(s): prof. RNDr. Josef Ježek, CSc.
Annotation - Czech
Posluchači získají přehled o metodách zpracování dat používaných v geovědách a na jednoduchých příkladech se naučí je aplikovat za pomoci počítače.
Last update: Ježek Josef, prof. RNDr., CSc. (21.01.2025)
Literature - Czech

Borradaile, G., Statistics of Earth Science Data. Springer-Verlag, 2003.

Davis, J.C., Statistics and data analysis in geology. John Wiley & Sons, 1973.

Fisher, N.I., Lewis, T., Embleton, B.I.J., Statistical analysis of spherical data. Cambridge Univ. Press, 1993.

Ježek, J., Geostatistika a prostorová interpolace. Nakladatelství Karolinum, 2015.

Ježek, J., Zpracování dat v geologii (pdf).


Last update: Ježek Josef, prof. RNDr., CSc. (14.10.2024)
Requirements to the exam - Czech

Požadavky k zápočtu:

Účast na cvičení a osvojení příslušných praktických dovedností, zejména aplikace probíraných metod na počítači.

Zápočtový test může být proveden zvlášť nebo spojen se zkouškou. Sestává z několika konkrétních úkolů splněných za pomoci počítače.

Požadavky ke zkoušce:

Splnění minimálního bodového limitu v písemném testu plus zodpovězení kontrolních otázek, které se týkají přímo testu nebo probrané látky.

Last update: Ježek Josef, prof. RNDr., CSc. (04.04.2012)
Syllabus - Czech

1-3) Popis a analýza dat prostřednictvím charakteristik, tabulek a grafů.

Data, jejich základní typy. Tabulka četností, histogram, krabicový graf. Unimodální a vícemodální, symetrické a sešikmené rozdělení. Charakteristiky polohy, variability a sešikmení. Standardizace. Popis vztahu dvou a více proměnných. Kovariance, korelační koeficient, koeficient pořadové korelace. Prokládání křivek a ploch. Lokální a globální metody interpolace. Lineární a polynomická interpolace, spline. Metoda nejmenších čtverců.

4) Základy pravděpodobnosti a matematické statistiky.

Náhodný jev, náhodná veličina. Pravděpodobnostní funkce, hustota pravděpodobnosti, distribuční funkce. Kvantily. Střední hodnota, rozptyl a směrodatná odchylka náhodné veličiny. Kovariance. Náhodný výběr, výběrové charakteristiky.

5) Rozdělení náhodných veličin.

Binomické a Poissonovo rozdělení. Normální rozdělení a jeho význam pro teorii matematické statistiky a pro přírodní vědy. Lognormální rozdělení. Rozdělení odvozená od normálního (t, chí-kvadrát, F). Dvojrozměrné normální rozdělení. Souvislost korelace a statistické závislosti náhodných veličin.

6-7) Intervaly spolehlivosti a a chyby laboratorních měření. 

Bodový x intervalový odhad. Rozdělení výběrových průměrů. Interval spolehlivosti pro střední hodnotu. Směrodatná chyba. Výpočet chyby odvozených veličin (šíření chyb). 

8) Testování hypotéz.

Princip testování hypotéz, souvislost s intervaly spolehlivosti. Testovací statistika, kritická hodnota a obor, hladina významnosti, p-hodnota. Jednovýběrový, dvouvýběrový a párový t-test, test shody rozptylů. Znaménkový test. Testování normality. Princip analýzy rozptylu.

9) Korelace a regrese.

Lineární regresní model, jeho statistická formulace a předpoklady. Kritéria kvality regresního modelu, koeficient determinace, pásy spolehlivosti, testy regresních koeficientů. Pearsonův a Spearmanův korelační koeficient a testování závislosti veličin jejich prostřednictvím. Statistická x věcná závislost veličin. Problém korelace uzavřených dat.

10) Vícerozměrná data.

Zobrazení vícerozměrných dat. Princip diskriminační analýzy. Shluková analýza, dendrogram. Analýza hlavních komponent, konstrukce a význam hlavních komponent a jejich interpretace.

11) Časové řady.

Dekompozice časové řady. Shlazování časových řad, vážený klouzavý průměr. Funkce vzájemné korelace a autokorelační funkce. Harmonická analýza, periodogram a spektrum. Princip filtrace v časové a frekvenční oblasti.

12) Prostorová data.

Základní způsoby interpolace a prezentace plošných dat. Gridding, trasování a shlazení izolinie. Metody IDW a RBF. Geostatistický přístup k interpolaci, variogram, kriging.

13) Analýza směrových dat.

Vektorová a osní data a jak s nimi pracujeme. Grafické znázornění, používané projekce. Rozdělení a charakteristiky směrových dat, intervaly spolehlivosti. Přednostní orientace. Orientační tenzor, jeho vlastní vektory a čísla. Woodcockův graf.

 

Last update: Ježek Josef, prof. RNDr., CSc. (21.01.2025)
Learning outcomes - Czech

Výstupy učení

 1-3) Popis a analýza dat prostřednictvím charakteristik, tabulek a grafů

  • Student bude schopen rozpoznat základní typy dat v geologii a způsoby jejich prezentace.
  • Student se seznámí se základními pojmy a metodami, které budou dále rozvíjeny v dalších přednáškách (popis jedné proměnné, popis vztahu mezi dvěma a více proměnnými, způsoby interpolace v čase a prostoru).
  • Student bude umět popsat a analyzovat data pomocí tabulek četností, histogramů, krabicových diagramů a x-y grafů.

 4) Základy pravděpodobnosti a matematické statistiky

  • Student se seznámí se základními pojmy matematické statistiky statistiky, jako jsou náhodné jevy, jejich rozdělení pravděpodobnosti a charakteristiky (kvantily, střední hodnota a rozptyl) a náhodný výběr.
  • Student bude umět vypočítat výběrový průměr, rozptyl, směrodatnou odchylku a další výběrové charakteristiky.

 5) Rozdělení náhodných veličin

  • Student bude schopen charakterizovat základní rozdělení náhodných veličin (binomické, Poissonovo, normální, lognormální) a jejich použití v geologických aplikacích.
  • Student se seznámí s teoretickými důvody pro ústřední postavení normálního rozdělení a se souvislostí mezi statistickou závislostí a korelací, kterou využijeme v dalších přednáškách.
  • Student bude umět načrtnout graf normálního rozdělení pro zadané parametry.

 6-7) Intervaly spolehlivosti a chyby laboratorních měření

  • Student bude schopen vysvětlit princip intervalového odhadu na příkladu intervalu spolehlivosti.
  • Student se seznámí  též s principy stanovení chyb laboratorních měření a výpočtu chyb odvozených veličin.
  • Student bude umět vypočítat interval spolehlivosti a vypočítat chybu odvozených veličin pro jednoduché případy.

8) Testování hypotéz

  • Student bude schopen vysvětlit princip testování hypotéz na základě jednovýběrového t-testu.
  • Student bude umět  provádět testování hypotéz pomocí t-testů a interpretovat výsledky statistických testů v kontextu geologických studií.

9) Korelace a regrese

  • Student bude schopen zapsat a interpretovat lineární regresní model a vyhodnotit model pomocí testů regresních koeficientů a koeficientu determinace.
  • Student bude umět analyzovat závislost mezi geologickými veličinami pomocí Pearsonova a Spearmanova korelačního koeficientu, a identifikovat věcnou závislost mezi proměnnými.

10) Vícerozměrná data

  • Student se seznámí se způsoby vizualizace a zpracování vícerozměrných  geologických dat pomocí metod diskriminační analýzy, shlukové analýzy a analýzy hlavních komponent.
  • Student bude umět  analyzovat vícerozměrná geologická data pomocí korelační a shlukové analýzy.

11) Časové řady

  • Student se seznámí s principy zpracování časových řad geologických dat a relevantními pojmy (klouzavý průměr, autokorelace, dekompozice časové řady, harmonická analýza, lineární filtrace).
  • Student bude umět aplikovat vážený klouzavý průměr a posoudit přítomnost autokorelace v časové řadě.

12) Prostorová data

  • Student se seznámí se základními způsoby interpolace a prezentace plošných geologických dat a s jejich statistickým popisem .
  • Student bude schopen provádět a zobrazit prostorovou interpolaci plošných geologických dat pomocí griddingu za použití metod IDW, RBF a krigingu.

13) Analýza směrových dat

  • Student se seznámí s grafickým znázorněním a popisem vektorových a osních dat a s jejich charakteristikami (střední směr, orientační tenzor, jeho vlastní vektory a čísla,  odvozené parametry a grafy).
  • Student bude schopen analyzovat přednostní orientaci směrových geologických dat.
Last update: Ježek Josef, prof. RNDr., CSc. (21.01.2025)
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html