Propojení světů biologů a informatiků

Monika Cechova

Pokud se někdo posledních 5 let pohyboval na Fakultě informatiky MU a najednou je jediný informatik v biologickém labu, tak musí získat novou sadu zkušeností – i v rámci softskills. Tento proces trvá několik let, ale když už člověk má tuto zkušenost, každá další spolupráce je mnohem, mnohem jednodušší.


Monika Čechová studovala bioinformatiku na Fakultě informatiky Masarykovy univerzity (FI MU), a s doktorským studiem pokračovala na americké univerzitě Penn State. Zabývá se výzkumem v oblasti biologie a bioinformatiky se zaměřením na pohlavní chromozomy, satelitní biologii, non - B DNA a reprodukční biologii. Ve svém článku “Ten simple rules for biologists initiating a collaboration with computer scientists” v časopise PLOS Computational Biology výstižně popisuje své bioinformatické zkušenosti shrnuté do desatera úspěšné spolupráce. Právě o tomto článku a výzkumu nám povykládala v rozhovoru.

Co vás přivedlo k tomu, studovat bioinformatiku?

Již na střední škole jsem věděla, že chci studovat informatiku, protože jsem v ní viděla obrovský potenciál. V předposledním ročníku jsme probírali genetiku, která mě naprosto fascinovala. Poté jsem viděla článek od docentky Fatimy Cvrčkové, který se jmenoval „Bioinformatika – na půl cestě mezi algoritmy a životem“, to bylo poprvé, kdy jsem si uvědomila, že tyhle dva světy – život reprezentovaný biologií a informatiku, lze propojit. Masarykova univerzita umožňovala velkou svobodu a flexibilitu ve výběru předmětů, proto jsem si mohla namíchat studium, jak mi vyhovovalo.

Myslíte tedy, že studium bioinformatiky postihuje velkou škálu jak z informatiky, tak z biologie?

Na bakaláři jsem studovala pouze informatiku a bioinformatiku jsem si zvolila až na magistra. S tím, že po celou dobu studia jsem si zapisovala předměty z obou oborů. Na přírodovědecké fakultě jsem se dostala ke genetice, k výzkumu s octomilkami a pipetování a na FI jsem absolvovala celou řadu informatických předmětů.

Takže na přírodovědě jste si zapisovala všechno, co vás zajímalo a bavilo?

Ano, přesně tak.

Připravilo vás studium bioinformatiky i na práci ve výzkumu?

Asi záleží v jaké fázi a v jaké oblasti výzkumu. V průběhu vědecké praxe jsem velmi ocenila, že v rámci bioinformatického studia nebyly žádné úlevy – absolvovali jsme všechny předměty, které by absolvoval informatik. Pokud bych mohla vrátit čas a poradit sama sobě ohledně studia, tak bych si poradila, abych si zapisovala víc teoretických a matematických předmětů. Protože právě tyto znalosti je těžší získat během praxe, konkrétně například ve složitosti algoritmů.

Na druhé straně bioinformatika může být dvojího charakteru. Buď to může být bioinformatika ve smyslu vývoje nových bioinformatických algoritmů, protokolů – něco co opravdu posouvá tento obor vpřed, nebo to může být aplikovaná bioinformatika, kdy vlastně člověk používá bioinformatické nástroje na zodpovězení biologických otázek. Takže bioinformatika je spíš nástroj – prostředek k dosažení cíle. Co se týče praktické zkušenosti, tam je osobní zkušenost nenahraditelná, ale zároveň díky tomu, že jsem informatiku vystudovala, tak jsem cítila, že v určitých oblastech mám vědomosti, nebo zkušenosti, které člověk, který přichází z biologického oboru, nemá. Čímž se vlastně dostáváme k tomu propojení a interdisciplinaritě.

To se také týká vašeho článku v časopise PLOS, kde popisujete desatero pro kvalitní spolupráci biologů a informatiků; co vás motivovalo k jeho napsání?

Dlouhodobé zkušenosti z práce s bioinformatiky. Během magisterského studia jsem se zaměstnala na Biofyzikálním ústavu Akademie věd. Působila jsem v biologické laboratoři, kde jsem na začátku byla jediný bioinformatik. Tým se postupně rozrůstal a přibývalo nás víc, ale na začátku jsem byla jediná, což přináší velké výzvy, protože biologové přemýšlí jinak. Není to tak, jak je to často ve filmech a seriálech, že se rodí a přemýšlí jinak, ale je to opravdu tréninkem – co se člověk učí během studia a k jakému typu myšlení je veden, jaké má zkušenosti. Některé zkušenosti, co jsem měla, byly až frustrující, ale na druhou stranu to byla výzva i pro biology – komunikovat se mnou a pochopit, co je pro mě důležité.

Na univerzitě Penn State bylo běžné, že v jedné místnosti seděl informatik, statistik a biolog. Ze všech těchto zkušeností jsem přemýšlela jednak nad tím, proč je tato interakce zajímavá a užitečná, jaké jsou bariéry pro kvalitní spolupráci a co se od sebe navzájem musíme naučit pro lepší komunikaci. Tenhle článek je něco, co jsem ve své hlavě psala několik let. Potom jsem jej tedy konečně sepsala na papír.

Trvalo vám dlouho, než jste se v týmu synchronizovali? Bylo těžké překonat bariéry?

Já si myslím, že to není jen o tom zvyknout si vždy na nové lidi, ale spíš naučit se to poprvé. Pokud se někdo posledních 5 let pohyboval na FI MU a najednou je jediný informatik v biologickém labu, tak musí získat novou sadu zkušeností – i v rámci softskills. Tento proces trvá několik let, ale když už člověk má tuto zkušenost, každá další spolupráce je mnohem, mnohem jednodušší. Z tohoto důvodu bych všem studentům bioinformatiky radila, aby co nejdřív využívali příležitostí mluvit s biology, se statistiky, dostat se na stejnou letní školu, na stejnou přednášku a jít spolu na kafe, virtuální kafe nebo konferenci. Čím víc takových běžných interakcí spolu budou mít, o to lepší bude společná věda.

Po magisterském studiu jste odjela na doktorát do Penn State v Americe. Proč jste se rozhodla pro Ameriku?

Na Biofyzikálním ústavu jsem studovala pohlavní chromozomy rostlin s docentem Eduardem Kejnovským. V rámci konference ve Francii jsem potkala svoji budoucí školitelku, která studovala pohlavní chromozomy lidoopů, což pro mě byla skvělá příležitost pokračovat v tématu zase někde jinde.

Jaké to bylo v Americe? Zaznamenala jste velké rozdíly oproti Česku?

Bylo to hodně jiné v tom, že bioinformatika na Penn State funguje jako samostatný obor. To znamená, že jsou laboratoře, kde je vedoucí bioinformatik a celá laboratoř je jen bioinformatická. Což je ten směr, který jsem předtím popisovala, vývoje nových bioinformatických algoritmů a posouvání možností bioinformatiky jako takové.

Studenti mají spoustu příležitostí zapisovat si stejné předměty, stejné workshopy, takže jedna z nejúžasnějších věcí byla, že interdisciplinarita se tam opravdu žila každodenním životem.


Zároveň je tam obrovské propojení jednotlivých laboratoří a oddělení a navíc velké množství přednášek napříč univerzitou. Studenti mají spoustu příležitostí zapisovat si stejné předměty, stejné workshopy, takže jedna z nejúžasnějších věcí byla, že interdisciplinarita se tam opravdu žila každodenním životem. Dokonce tam byly i speciální tréninkové programy specificky navržené pro posílení interdisciplinarity – biologie, informatiky a statistiky. Pak z těch víc každodenních věcí byly velmi příjemné finanční možnosti, co se týče navrhování experimentů.

Jak jsem říkala, na FI MU jsem si zapisovala různé předměty. Někdy pro mě bylo těžké pochopit širší kontext daného oboru a musela jsem věřit, že to využití někde bude. Zatímco na Penn State byla celá první hodina (opravdu 50 minut) věnovaná tomu, proč je ten předmět tak důležitý. Když se mi to stalo poprvé, měla jsem pocit, že je to plýtvání časem, ale zpětně to hodnotím velmi pozitivně.

V Americe jste už zůstat nechtěla?

Jedno z velkých lákadel návratu bylo, opět se vidět s rodinou. Během studia jsme s manželem vychovávali syna, takže jeden z důvodů bylo, aby se naučil česky a aby žil v blízkosti rodiny. Druhý důvod byl ten, že si myslíme, že výzkum jak v Life Sciences, tak v bioinformatice je na vzestupu, takže když ne teď, tak v budoucnosti, tady ty možnosti budou.

Takže si myslíte, že budoucí bioinformatici najdou v Brně uplatnění?

Myslím, že určitě. A už nyní je poznat, že výzkum chybí. Například v současné koronavirové epidemii je velmi důležité sledovat, jaké varianty koronaviru se nacházejí v jakých zemích, jak se virus mění, jak mutuje a jaké jsou důsledky mutací. To je něco, co bioinformatika umí a dokáže.

Věnovala jste se Y chromosomu u opic. Proč je toto téma tak důležité? Jaká je za ním motivace?

Hlavní motivace je taková, že Y chromozom obsahuje geny, které jsou důležité pro plodnost a spermatogenezi. Zároveň je jeho organizace taková, že je velmi těžké ho zkoumat. I u lidí je velmi těžké dostat úplnou genetickou informaci. Víme, že Y chromozom u člověka je dynamický, to znamená, že dochází k různým přeskupením, kdy se část chromozomu úplně ztratí a následek toho je neplodnost.

U člověku nejbližších příbuzných – lidoopů jsme měli informaci ohledně Y chromozomu šimpanze. Již v minulosti se zjistilo, že Y chromozom šimpanze je úplně jiný než ten lidský. Jako kdyby spousta genů, které člověk má a jsou pro něj důležité, šimpanz vůbec nepotřeboval. To byla jedna z velkých záhad. Tím, že jsme úplně na novo poskládali a zkoumali Y chromozom šimpanze Bonobo a orangutana, tak jsme dokázali dát tuto skládanku dohromady a odpovědět na otázky, jestli je v tomto ohledu šimpanz zvláštní a jaká je evoluce chromozomu.

Konkrétně u šimpanze je velká promiskuita v rámci páření, takže evoluce chromozomu může souviset i s evolučním tlakem, aby měl šimpanz hodně spermií a aby se u konkrétního jedince prosadili.

Jaký je u takového výzkumu postup?

Největší výzva byla, že neexistovaly žádné informatické postupy, jak Y chromozom poskládat. Všechny přístupy, které byly do té doby, jsou pracné, finančně náročné a trvaly by spoustu let. Zatímco náš cíl byl tyhle chromozomy poskládat pomocí Next-generation sequencing, v rámci kterého je několik technologií. Chtěli jsme tedy vymyslet kombinaci propojení těchto technologií. Dokážeme například číst velice krátké sekvence DNA, ale velmi přesně, nebo velice dlouhé sekvence ale velmi nepřesně. Takže vymyslet ideální kombinaci pro nás bylo opravdu důležité.

V jenom paperu kolegové analyzovali 100 mužů a v rámci nich našli 98 kombinací počtů genu na Y chromosomu. To znamená, že jeden perfektně zdravý muž může mít například u jednoho genu 15 kopií a nějaký jeho kolega může mít 20 kopií a oba jsou zdraví a plodní, takže je záhada, jak je možné, že je u těchto genů tak obrovská variabilita.

Tato čtení jsou momentálně velice dlouhá a velice chybová, ale postupně se to zlepšuje. Máme čím dál tím lepší sekvence také díky pokroku v Machine Learning a informatice.


Jsou v Brně vůbec vhodné přístroje pro váš výzkum?

Částečně ano, ale část je ve Vídni. Další možnost je sekvenování za pomocí Oxford Nanopore, což je taková malinká krabička, která se zapojí přes USB do počítače a je možné okamžitě sekvenovat. Tato čtení jsou momentálně velice dlouhá a velice chybová, ale postupně se to zlepšuje. Máme čím dál tím lepší sekvence také díky pokroku v Machine Learning a informatice. Lépe dokážeme převést elektrický signál na samotnou sekvenci. Toto využívá v Brně docela dost laboratoří, takže výzva je i v tom, jak připravit vzorek, aby byl co nejméně poškozený, aby DNA byla co nejvíc zachovaná a dlouhá a aby analýza a interpretace byla kvalitní, což je vždycky výzva.

A jak jsou tato data potom reprezentovaná v počítači?

Je právě zajímavé, že v nejtradičnějším provedení to je textový soubor. Na Penn State jsem fungovala i jako teaching assistant, takže jsem učila bioinformatiku americké studenty. Na cvičení jsme získali DNA různých zvířat, studenti vůbec nevěděli, co dostali, ale měli určit, o co se jedná. Připravili jsme vzorek na sekvenování, to trvá několik hodin, potom jsme ho načetli, zapnuli sekvenování a za 2 minuty už byly k dispozici první sekvence. Takže jsme hned měli textový soubor a mohli jsme číst, co ve vzorku bylo.

Také záleží, do jaké hloubky chce výzkumník dělat analýzu, vždycky je možné jít o krok zpátky a dívat se na elektrický signál. Molekula, během sekvenování, prochází umělým pórem a mění elektrický signál. Na čtení existuje spousta algoritmů, včetně neuronových sítí, které se data snaží přeložit na sekvenci.

Autorka: Klára Petrovičová pro fi.muni.cz
Bioinformatika
Bioinformatiku lze na FI MU studovat jak na bakalářském, tak na magisterském studiu. Právě specializace Bioinformatika na FI je určena pro studenty, kteří chtějí získat vedle všeobecných poznatků z informatiky i nejnovější znalosti z biologie. Zároveň se mohou zapojit do výzkumu například v Laboratoři systémové biologie (SYBILA).

Galerie absolventů