Informatika v živých vědách

Podokruhy 1-3 jsou zaměřeny na teoretické základy mezioborové problematiky bioinformatiky a výpočetní systémové biologie. Podokruhy 4-5 pokrývají aktuální výzkumná témata v oblasti pokročilých výpočetních metod a metod strojového učení v živých vědách.

1) Bioinformatika – sekvence a genomika

Anotace:
Uchazeč se seznámí s algoritmickými základy práce s biologickými sekvencemi (hledání motivů, zarovnávání, mapování, skládání) a praktickými otázkami zpracování NGS dat, anotace genomů nebo tvorby fylogenetických stromů. Poté se soustředí na vybrané partie odpovídající odborným zájmům a zaměření doktorské práce.

Osnova:
Zdroje a typy sekvenčních dat. Online a offline algoritmy pro prohledávání a porovnávání sekvencí. Zarovnávání, mapování sekvencí a fylogenetické stromy. Skryté Markovovy modely a metody strojového učení na sekvencích. Genomika, metagenomika, sekvenační technologie a skládání genomů. Anotace genomů. Osvědčené postupy a softwarové nástroje v bioinformatice a genomice.

Základní studijní materiál:

  • Stuart M. Brown. Next-generation DNA sequencing informatics. Cold Spring Harbor Laboratory Press, 2015.
  • Naiara Rodríguez-Ezpeleta et al. Bioinformatics for high throughput sequencing. Springer, 2012.

Zkoušející: Ing. Matej Lexa, Ph.D, doc. RNDr. David Šafránek, Ph.D.

Další doporučená literatura:

  • Phillip Compeau and Pavel Pevzner. Bioinformatics algorithms : an active learning approach. Active Learning Publishers, 2014.
  • A. Malcolm Campbell and Laurie J. Heyer. Discovering genomics, proteomics, and bioinformatics. CSHL Press, c2007.
  • David W. Mount. Bioinformatics: sequence and genome analysis. Cold Spring Harbor Laboratory Press, 2001.

2) Bioinformatika – struktura a funkce proteinů

Anotace:
Uchazeč se seznámí s algoritmickými základy práce s proteinovými sekvencemi (hledání motivů, zarovnávání) a strukturami (sekvenční profily, srovnávání a klasifikace struktur proteinů, predikce struktury a funkce ze sekvence). Poté se soustředí na vybrané partie odpovídající odborným zájmům a zaměření doktorské práce.

Osnova:
Zdroje a typy sekvenčních a strukturních dat o proteinech. HMM a metody strojového učení na proteinech. Fyzikální a chemické základy struktury proteinů a evoluční analýza jejich sekvencí a struktur. Predikce 3-D struktury proteinů se/bez znalostí homologů. Vizualizace a anotace proteinových struktur. Osvědčené postupy a softwarové nástroje ve strukturní a evoluční bioinformatice.

Základní studijní materiál:

  • Jenny Gu and Philip E. Bourne. Structural bioinformatics. Wiley-Blackwell, 2009.

Zkoušející: Ing. Matej Lexa, Ph.D, doc. RNDr. Barbora Kozlíková, Ph.D.

Další doporučená literatura:

  • John M. Hancock and Marketa J. Zvelebil. Concise encyclopaedia of bioinformatics and computational biology. Wiley Blackwell, 2014.
  • A. Malcolm Campbell and Laurie J. Heyer. Discovering genomics, proteomics, and bioinformatics. CSHL Press, 2007.
  • David W. Mount. Bioinformatics: sequence and genome analysis. Cold Spring Harbor Laboratory Press, 2001.

3) Digitální systémová biologie

Anotace: Student se seznámí se základními metodami a technikami z oblasti využití výpočetních metod pro modelování a analýzu biologických systémů a odpovídajících aplikací. Specifický důraz je kladen na uchopení živé hmoty jako komplexního dynamického systému. Dle domluvy se studentem je možné se zaměřit na látku, která přímo souvisí s tématem disertační práce.

Osnova: Základní koncepty systémového přístupu k biologickým systémům, specifikace biologického systému, dynamika biochemických reakcí, stochastické modelování a simulace, signální dráhy, regulační sítě, modelování buněčných komunikačních sítí a drah, validace modelu, algoritmy pro automatizaci analýzy modelů.

Základní studijní materiál:

  • Olaf Wolkenhauer: Systems Biology - Dynamic Pathways Modeling, Rostock University, 2012 (available with the author's permission as an electronic copy from the examiner)
  • Marco Bernardo, Erik de Vink, Alessandra Di Pierro , Herbert Wiklicky (Eds.): Formal Methods for Dynamical Systems, SFM 2013. Springer. Bertinoro, Italy, June 17-22, 2013 Bernardo, Marco; Degano, Pierpaolo; Zavattaro, Gianluigi (Eds.): Formal Methods for Computational Systems Biology. SFM 2008 Bertinoro, Italy, June 2-7, 2008. Springer. Chapters will be specified for the student individually.

Zkoušející: prof. RNDr. Luboš Brim, CSc., doc. RNDr. David Šafránek, Ph.D.

Další doporučená literatura:

  • Uri Alon: An Introduction to Systems Biology - Design Principles of Biological Circuits. Chapman & Hall / CRC, 2007.
  • Eda Klip et al. Systems biology: a textbook. Wiley-VCH Verlag, 2009.
  • Darren James Wilkinson. Stochastic modelling for systems biology. Chapman & Hall / CRC, 2006.

4) Výpočetní metody v systémové biologii

Anotace:
Student se seznámí na expertní úrovni s nejnovějšími vědeckými poznatky z oblasti využití výpočetních metod pro modelování a analýzu biologických systémů a odpovídajících aplikací.

Osnova:
Formalizmy a jazyky pro modelování biologických procesů: rule-based jazyky, Booleovské sítě, Petriho sítě. Techniky a nástroje pro verifikaci, validaci, analýzu a simulaci biologických systémů. Paralelní a vysoce výkonné výpočetní metody v systémové biologii.

Základní studijní materiál:
3-4 články z posledních ročníků konference Computational Methods in Systems Biology, časopisů Briefings in Bioinformatics, Bioinformatics, PLoS Computational Biology, BMC Systems Biology a případně dalších podle doporučení zkoušejícího. Články budou pro studenta upřesněny individuálně.

Zkoušející: doc. RNDr. David Šafránek, Ph.D., prof. RNDr. Luboš Brim, CSc.

5) Aplikace strojového učení v živých vědách

Anotace:
V posledních letech pomohly pokročilé techniky strojového učení, jako je hluboké, reprezentační a relační učení, v řadě průlomů v oblasti živých věd (příklady dvou takových úspěchů jsou: diagnostický model Stanfordu pro melanom v roce 2017, srovnatelný s dermatologem, nebo radikální zlepšení predikce struktury proteinů od Google Deep Mind v roce 2020). To bylo umožněno rostoucí uplatnitelností metod strojového učení a obrovským množstvím a počtem datových souborů v živých vědách, které jsou k dispozici pro strojové zpracování, jak je uvedeno v obou průzkumech, které tvoří základní studijní materiál.

Pomocí těchto průzkumů se kandidát seznámí s obecnými principy aplikací hlubokého a relačního učení v biomedicíně. Dále si uchazeč vybere konkrétní datové soubory a techniky, které odpovídají zaměření jejich disertační práce, a podrobně se s nimi seznámí.

Osnova:
Biomedicínské aplikace hlubokého učení; Reprezenční učení pro živé vědy; Relační učení pro pro živé vědy; Síťová biologie; Síťová medicína; Biomedicínské znalostní grafy; Vnoření biomedicínských znalostních grafů; Predikce struktury, interakcí a funkce bílkovin; Predikce asociace genů a chorob; Objevování léků a farmakovigilance; Přesná medicína; Podpora klinického rozhodování

Základní studijní materiál:

  • Ching, Travers, et al. Opportunities and obstacles for deep learning in biology and medicine. Journal of The Royal Society Interface 15.141 (2018): 20170387.
  • Li, Michelle M., Kexin Huang, and Marinka Zitnik. Representation Learning for Networks in Biology and Medicine: Advancements, Challenges, and Opportunities. arXiv preprint arXiv:2104.04883 (2021).

Zkoušející: Mgr. Vít Nováček, Ph.D., doc. RNDr. Tomáš Brázdil, Ph.D.

Další doporučená literatura:

  • Murphy, Kevin P. Machine learning: a probabilistic perspective. MIT press, 2012.
  • Bengio Y, Goodfellow I, Courville A. Deep learning. MIT press, 2017.
  • Ji, Shaoxiong, et al. A Survey on Knowledge Graphs: Representation, Acquisition, and Applications. IEEE Transactions on Neural Networks and Learning Systems (2021).