Rozluštění kódu života: s Prajnou Hebbar o budoucnosti genomiky
Jak porozumět obrovskému množství informací ukrytých v genomu? A co se stane, až je konečně kompletně zmapujeme? Prajna Hebbar z Kalifornské univerzity v Santa Cruz pracuje na pomezí informatiky a biologie a vyvíjí nástroje pro anotování a porovnávání genomů různých druhů. Při návštěvě Fakulty informatiky MU se podělila o své nejnovější pokroky ve vývoji nástroje Comparative Annotation Toolkit 2.0 a diskutovala o tom, jak kompletní genomy mění naše chápání evoluce a lidských onemocnění.
Mohla byste nám popsat svou výzkumnou dráhu? Co vás přivedlo k oblasti komparativní genomiky a pan-genomiky, která staví na zkoumání a srovnávání celých genomových sekvencí a struktur mezi různými druhy? Co vás na práci v této oblasti nejvíce baví?
Začala jsem jako studentka informatiky se zájmem o propojení informatiky a biologie. Nadšeně jsem se během dvouletého studia zapojila do různých forem výzkumu v oblasti výpočetní biologie. Což mě nakonec motivovalo k tomu, abych v této oblasti pokračovala v doktorském studiu. Při hledání vhodné univerzity a zaměření pro svůj doktorát jsem narazila na výzkum v oblasti komparativní genomiky a pan-genomiky, který probíhá v mé stávající laboratoři, a od té chvíle jsem neměla pochyb. Skutečně mě baví pracovat na špičce genomického výzkumu, který mi umožňuje jak přístup k nejnovějším vysoce kvalitním datovým sadám, tak k vývoji nástrojů pro jejich analýzu.
Genom je vlastně soubor genetických informací konkrétního organismu ukrytých v DNA.V jedné ze svých přednášek na FI MU jste se zaměřila na Comparative Annotation Toolkit 2.0 (CAT2.0), software pro automatizované, vysoce kvalitní označení velkého počtu vzájemně příbuzných genomů. Pro čtenáře, kteří nejsou odborníky: proč je přesná anotace genů tak důležitým krokem v genomice?
Na anotaci genů pohlížím jako na něco, co dává genomu smysl, říká nám, co kde je a co to dělá. Většina souvisejícího výzkumu genomu se při biologických závěrech opírá o tyto anotace. Pokud je označení nesprávné nebo neúplné, může to ohrozit všechny analýzy, které na ní staví. Proto jsou přesné anotace genů nezbytné pro spolehlivou vědu.
CAT2.0 má usnadnit proces, který jinak vyžaduje řadu nástrojů a spoustu ruční práce. Jak toho dosahuje?
CAT2.0 spojuje různé zdroje informací pro popis genů: srovnání bez referencí (hledání podobných částí v různých genomech, aniž by se jeden z nich bral jako vzor), párová srovnání, srovnání proteinů a důkazy o expresi genů v tkáních. Každý z těchto přístupů má své silné a slabé stránky. Jejich kombinací CAT2.0 zvyšuje přesnost a zároveň snižuje potřebu ruční kontroly. Tato efektivita je obzvláště důležitá u rozsáhlých projektů, jako je Human Pangenome nebo T2T Primates, mapující celé populace druhů, kde je třeba konzistentně a rychle anotovat desítky nebo stovky genomů.
Přímo jste se podílela na projektech zaměřených na sestavení kompletních genomů, např. genomu kosmana obecného, tzv. od telomery k telomerě (T2T), tedy od první koncové části chromozomu k té poslední. Proč je přečtení kompletního genomu tak důležitý pro evoluční a biomedicínský výzkum?
Kompletní genom doplňuje dosud chybějící části – zejména v komplexních a repetitivních oblastech, jako jsou segmentové duplikace, centromery a satelitní DNA. Tyto oblasti často hrají klíčovou roli, například v regulaci genů a evoluci, ale v minulosti byly nedostatečně prozkoumány, protože jejich sestavení bylo velmi obtížné. Přečtením genomu získáváme přesnější statistiky mapování, lepší vhled do strukturálních variant a spolehlivější základnu pro biomedicínský výzkum.
Ve druhé přednášce jste se věnovala kosmanům. Co dělá tuto ploskonosou opici tak cenným modelovým organismem a jaké nové poznatky můžeme očekávat od jejího kompletního genomu?
Kosman obecný je cenným modelovým organismem pro výzkum díky své velikosti, rychlému rozmnožování a biologické podobnosti s člověkem. Znalost kompletního genomu nám otevírá nové možnosti: můžeme lépe studovat oblasti spojené s neurologickými rysy, identifikovat strukturální varianty a zdokonalit jeho využití jako modelu pro zkoumání lidských chorob.
Vaše výzkumná činnost často zahrnuje mezinárodní spolupráci. Jak projekty jako Human Pangenome řeší spolupráci mezi tolika laboratořemi a vědci?
Tyto velké mezinárodní projekty jsou úspěšné díky závazku k otevřené vědě a spolehlivé komunikaci. Týmy otevřeně sdílejí svá data a pracovní postupy, což umožňuje přispívat výzkumníkům z celého světa. Tyto projekty také pravidelně pořádají workshopy a konference, aby přilákaly širší publikum.
Navštívila jste FI MU na pozvání Moniky Čechové. Mohla byste nám přiblížit vaši spolupráci, jak začala a jakými směry se společně ubíráte?
S Monikou jsme se seznámily, když jsem začínala doktorát a ona byla postdoktorandkou ve skupině Karen Miga na Kalifornské univerzitě v Santa Cruz. Od té doby je mou mentorkou a kolegyní. Sdílíme zájem o pan-genomy a sestavování genomů, zejména o biologii „komplexních“ genomových oblastí, jako jsou akrocentrické chromozomy nebo chromozom Y. Naše spolupráce pokračuje v hledání nových metod a datových sad, které nám pomohou lépe porozumět těmto náročným oblastem.

Foto: Prajna Hebbar a Monika Čechová
Řada studujících FI MU právě nastupuje do oboru bioinformatiky. Jakou radu byste jim dala, pokud chtějí být součástí nejmodernějších projektů zaměřených na sestavování genomů nebo jejich anotace?
Myslím, že nejdůležitější je začít budováním pevných základů jak v biologii, tak v počítačových metodách, protože obě tyto oblasti jsou stejně důležité. Musejí se dobře naučit programovat a pracovat ve vysoce výkonných výpočetních prostředích, protože to je pro bioinformatiky nezbytné. Zároveň se snažte prozkoumat a pochopit biologické otázky, které jsou hnacím motorem výzkumu. A nakonec se nebojte mluvit s výzkumníky – je to jeden z nejlepších způsobů, jak se učit a navazovat kontakty.
Co je podle vás další velkou výzvou nebo příležitostí v oblasti srovnávací genomiky a anotace – něco, na čem by dnešní studující mohli pracovat během své kariéry?
Jednou z největších výzev bude rozšíření našich současných metod srovnávací genomiky na tisíce a desítky tisíc genomů. V genomice se posouváme do éry, kdy už nebudeme mít jen jeden referenční genom pro každý druh, ale komplexní pan-genomové referenční soubory, které zachycují rozmanitost na úrovni populací. Musíme vyvinout nástroje, které zvládnou tuto složitost a budou přístupné širší vědecké komunitě. Myslím, že to bude důležitá výzva pro budoucí výzkum.
Prajna Hebbar je doktorandkou na Katedře biomolekulárního inženýrství Kalifornské univerzity v Santa Cruz pod vedením Dr. Benedicta Patena. Věnuje se vývoji metod pro komparativní genomiku a pan-genomiku se zaměřením na genovou anotaci. Její nejnovější úsilí směřuje k anotování lidského pangenomu a sestavení kompletního lidského transkriptomu, tedy jakési mapy všech genů a jejich aktivity v lidském těle. Pracuje také na sestavení a anotování kompletního genomu (T2T) kosmana obecného. V minulosti hrála klíčovou roli v projektu T2T Primates.
Ve dnech 22. a 23. září 2025 navštívila Fakultu informatiky Masarykovy univerzity, kde přednesla přednášky s názvem „Comparative Annotation Toolkit 2.0: Generování vysoce kvalitních genových anotací kompletních genomů primátů a lidských pangenomů pro studium evoluce genů“ a „Kompletní sestavení genomu kosmana obecného“.
Autorka: Marta Vrlová, Oddělení vnějších vztahů a spolupráce s partnery FI MU