Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Developing machine learning tools for reactive atomistic material modelling

Název práce v češtině:	Vývoj nástrojů strojového učení pro reaktivní atomistické modelování materiálů
Název v anglickém jazyce:	Developing machine learning tools for reactive atomistic material modelling
Klíčová slova:	materiály, teorie hustotního funkcionálu, strojové učení, silová pole, pokročilé techniky samplování fázového prostoru
Klíčová slova anglicky:	materials, density functional theory, machine learning, force fields, advanced methods of phase space sampling
Akademický rok vypsání:	2025/2026
Typ práce:	disertační práce
Jazyk práce:	angličtina
Ústav:	Katedra fyzikální a makromol. chemie (31-260)
Vedoucí / školitel:	doc. RNDr. Lukáš Grajciar, Ph.D.
Řešitel:
Konzultanti:	Christopher James Heard, Ph.D.

Předběžná náplň práce

Silová pole strojového učení:
- Generování referenční ab initio databáze dat energií/sil a/nebo jejich data-mining z existujících datových sad, např. pomocí víceúlohového učení (např. podobně jako v https://doi.org/10.26434/ chemrxiv-2023-8n737)
– Trénink silových polí založených na strojovém učení pomocí hlubokých neuronových sítí (např. pomocí ekvivariantních message-passing sítí, jako je MACE)
- Dotrénovávání silových polí strojového učení pomocí různých metod aktivního učení (query-by-commitee, Gaussian mixture modely, uncertainty-driven samplovaní ala https://arxiv.org/abs/2402.03753 nebo uncertainty attribution ala https://www .nature.com/articles/s41467-024-50407-9)
- Transfer-learning (např. prostřednictvím konformačního vzorkování navrženého zde 10.1021/acs.jctc.4c00643) k rozšíření použitelnosti silových polí strojového učení na podobné systémy a delta-learning ke zlepšení přesnosti silových polí strojového učení na pro specifické případy

Predikce vlastností pomocí strojového učení:
- Generování referenční ab initio databáze pre (tenzoriálne) vlastnosti (např. NMR tenzory, Bornovy tenzory efektivního náboje pro IR) a/nebo jejich data-mining z existujících datových sad
- Trénink modelů na predikci vlastností založených na strojovém učení pomocí hlubokých neuronových sítí a/nebo kernel ridge regrese (nebo gaussian process regression)

Pokročilá (akcelerovaná strojovým učením) samplovaní struktur a reakčných cest:
- vývoj a implementace nástrojů pro globální optimalizaci struktur (např. akcelerované pomocí gaussian process regressoin, viz např. 10.1103/PhysRevLett.124.086102)
- zrychlení a vylepšení metod pro určování/mapování reakčních sítí (např. prostřednictvím softvérového balíčku OPTIM https://www-wales.ch.cam.ac.uk/OPTIM/)
- vývoj a použití metod pro hledání reakčních koordinát za použití strojového učení (např. pomocí automatického kodéru spojeného s neuronovou sítí, viz např. 10.1021/acs.jctc.2c00729 nebo PINES 10.1021/acs.jctc.3c00923s) umožnující efektivní biasované simulace pro: i) specifické reakce, ii) pro komplexní reakce v (reaktivních) rozpouštědlech, a iii) pro fázové přechody.
- vývoj a použití pokročilé (biasované) molekulární dynamiky a (hybridních) schémat Monte Carlo (MC) (např. OPES, kinetické MC pro modelování reakčních sítí, nebo transition matrix matice MC pro modelování adsorpce, atd.)

Testovací systémy a dál:
- rozsáhlá knihovna důkladně prozkoumaných aplikačních systémů v rámci skupiny (zeolity, oxidické povrchy, kovové klastry na nosičích, atd.) pro testování/ladění metod
- možnost aplikovat vyvinutou sadu nástrojů pro velkou aplikační výzvu, a to modelování syntézy zeolitických materiálů

Networking vrámcí existujících spoluprací:
Silová pole strojového učení a modely predikce vlastností založené na strojovém učení:
R. Gomez-Bombarelli (MIT, USA); Alin M. Elena (STFC, UK); A. Fortunelli (U Pisa, IT); A. Bartok-Partay (U Warwick, UK)
Pokročilá (akcelerovaná strojovým učením) samplovaní struktur a reakčných cest::
D. Wales (U Cambridge, UK); V. van Speybroeck (U Gent, BE); L. Bonati (IIT Janov, IT), T. Bučko (U Komenského, SK)

Relevantní publikace:
1. Nature Communications, 2024, doi: 10.1038/s41467-024-48609-2
2. npj Computational Materials, 2022, doi: 10.1038/s41524-022-00865-w
3. Digital Discovery, 2025, doi: 10.1039/D4DD00306C
4. Journal of Chemical Theory and Computation, 2023, doi: 10.1021/acs.jctc.2c00729
5. Proceedings of Machine Learning Research, 2023, doi: 10.48550/arXiv.2301.03480

Předběžná náplň práce v anglickém jazyce

Machine learning force fields (MLFFs):
- Generation of reference ab initio database of energy/force/stress data and/or data mining of thereof and/or combination of existing datasets via, e.g., multi-task learning (e.g., ala https://doi.org/10.26434/chemrxiv-2023-8n737)
- Training of machine learning force fields using deep neural networks (e.g., using equivariant message passing networks such as MACE)
- Fine-tuning the machine learning force fields via various active-learning methods (query-by-committee, Gaussian mixture models, uncertainty driven enhanced sampling ala https://arxiv.org/abs/2402.03753 or uncertainty attribution https://www.nature.com/articles/s41467-024-50407-9)
- Transfer-learning (e.g., via conformational sampling proposed here 10.1021/acs.jctc.4c00643) to extend the applicability of MLFFs to similar systems and delta-learning to improve the accuracy of the baseline MLFFs for the case/reaction of interest

Machine learning driven (tensorial) property prediction:
- Generation of reference ab initio database of tensorial (NMR tensors, Born effective charge tensors for IR) and/or data mining of thereof
- Training of ML-based predictors using deep neural networks and/or kernel ridge regression (gaussian process regression)
Advanced (ML-accelerated) structure and reaction sampling:
- development and deployment of tools for global structure search (e.g., ML-accelerated via Gaussian process regression such as here 10.1103/PhysRevLett.124.086102)
- acceleration and improvement of methods for reaction network search/mapping (e.g., via OPTIM package https://www-wales.ch.cam.ac.uk/OPTIM/)
- development and deployment of ML-based collective variables (e.g., using autoencoder joined with message passing neural network such as here 10.1021/acs.jctc.2c00729 or in PINES 10.1021/acs.jctc.3c00923s) for enhanced sampling molecular dynamics simulations for: i) specific reactions, ii) for complex reaction in (reactive) solvents, and iii) for phase transitions.
- development and deployment of advanced (biased) molecular dynamics and (hybrid) Monte Carlo (MC) schemes (e.g., OPES - on-the-fly probability enhanced sampling method, kinetic MC for reaction network modelling, transition matrix MC for adsorption modelling, etc.)

Testing systems and beyond:
- extensive library of in-group-thoroughly investigated application systems (zeolites, oxidic surfaces, embedded metal clusters, etc.) for testing/fine-tuning the methods
- an optionality to deploy the herein implemented/developed toolkit for a grand application challenge of modelling synthesis of zeolitic materials

Networking and collaboration:
MLFFs & ML-based property predictors:
R. Gomez-Bombarelli (MIT, US); Alin M. Elena (STFC, UK); A. Fortunelli (U Pisa, IT); A. Bartok-Partay (U Warwick, UK)
ML-accelerated structure and reaction sampling:
D. Wales (U Cambridge, UK); V. van Speybroeck (U Gent, BE); L. Bonati (IIT Genoa, IT), T. Bucko (U Komenskeho, SK)

Relevant Publications:
1. Nature Communications, 2024, doi: 10.1038/s41467-024-48609-2
2. npj Computational Materials, 2022, doi: 10.1038/s41524-022-00865-w
3. Digital Discovery, 2025, doi: 10.1039/D4DD00306C
4. Journal of Chemical Theory and Computation, 2023, doi: 10.1021/acs.jctc.2c00729
5. Proceedings of Machine Learning Research, 2023, doi: 10.48550/arXiv.2301.03480