Matriky studentů vysokých škol v ČR a jejich informační hodnota

Vladimír Šmíd, Jana Kohoutková

 
 

Abstrakt
Projekt „Sdružené informace matrik studentů“ je zaměřen na sběr informací z nezávislých matrik studentů jednotlivých vysokých škol ČR do celostátního informačního systému provozovaného Ministerstvem školství, mládeže a tělovýchovy ČR – s následným centrálním zpracováním a prezentací výstupů specifickým třídám oprávněných uživatelů.  S odvoláním na zákony vymezující účel a využití matrik studentů je příspěvek zaměřen na popis povinného datového obsahu a základních souborných výstupů, vyžádaných provozovatelem systému, a stručně zmiňuje dosavadní historii sběrů a zpracování dat ve sdružené databázi.
 
 

1. Úvod
Zákon o vysokých školách [1] v § 101 odst. 4 uložil vysokým školám povinnost zapsat veškeré studenty na nich studující ke dni 1.1.1999 do matriky studentů a podle § 88 posléze tuto evidenci dále vést. Bylo to vlastně poprvé v naší historii, kdy byla vysokým školám tato povinnost zákonem konkrétně určena a specifikovány alespoň základní podmínky pro nakládání s těmito daty. Zákon [1] přímo stanovuje účel matriky, která podle něj slouží „k evidenci o studentech a k rozpočtovým a statistickým účelům“. V § 87 písm. i) zákona byla v rámci definice působnosti Ministerstva školství, mládeže a tělovýchovy ČR (MŠMT) stanovena možnost sdružovat a využívat informace z matrik studentů jednotlivých vysokých škol, a to jak u veřejných, tak u soukromých vysokých škol (pouze v případě státních vysokých škol je tato působnost speciálně svěřena vždy příslušnému ministerstvu – obrany, resp. vnitra). Pro realizaci projektu Databáze Sdružených Informací Matrik Studentů (zkráceně SIMS – použito v dalším textu) vypsalo MŠMT na podzim 1998 výběrové řízení a na základě jeho výsledku byla realizací pověřena Masarykova univerzita v Brně.

2. Základní požadavky
Zadáním projektu SIMS bylo vybudovat systém pro sběr a zpracování dat z matrik studentů vysokých škol, v němž jsou jak zdrojová data, tak zpracované výstupy diferencovaně přístupné různým skupinám oprávněných uživatelů, primárně MŠMT ČR. Jako vedlejší efekt byla proklamována snaha sjednotit pokud možno všechna dosavadní předávání dat, týkající se studentů, ve směru od vysokých škol k ústřednímu orgánu do jediné formy.
Cílem projektu tedy bylo definovat rozhraní mezi zdroji dat (samostatnými informačními systémy vysokých škol) a centrálním systémem SIMS, zprůchodnit zabezpečený přenos informací přes tato rozhraní a zajistit jejich centrální zpracování a diferencovanou přístupnost. K obecným požadavkům kladeným na SIMS přirozeně patřilo i zajištění autenticity uživatelů a nepopiratelnosti dat.

3. Data matriky
Prvotním problémem uvedeného řešení byla sama definice datové věty. Jednak se vycházelo z definice dat matriky studentů stanovené přímo v § 88 odst. 2 a 3 zákona [1]. Současně musela datová struktura vyhovět § 21 odst. 1 písm. c), podle kterého je vysoká škola povinna poskytovat Akreditační komisi a MŠMT potřebné informace pro jejich činnost podle zákona [1]. A v neposlední řadě šlo i o sběr takových údajů, na jejichž základě by v budoucnu mohly být nahrazeny závazné výkazy v působnosti Českého statistického úřadu (zejména pak výkazy Škol V11-01 „o vysoké škole“ a Škol V12-01 „o absolventech vysokých škol“). Vzhledem k tomu, že se jedná o zpracovávání osobních dat, přistoupil k tomu z druhé strany princip nesbírání více údajů, než je nutné k danému účelu.

Vznikla tak věta obsahující 46 významových datových položek. Z toho plných 42 bylo odvozeno přímo ze zákonné definice matriky studentů, aniž by bylo třeba použít ne zrovna šťastné slůvko „zejména“ ve zmiňované definici uvedené. Další tři položky byly požadovány MŠMT jako nezbytné pro rozpočtové/dotační účely. Zde se jedná o

A nakonec se tam objevila ještě jedna položka nutná pro korelaci s výše uváděnými výkazy státní statistiky – „Národnost“, a to při plném uvědomění si problémů s ní spojených jako s citlivým údajem ve smyslu tehdejšího zákona o ochraně osobních údajů v informačních systémech [2]. Vzhledem k nové situaci, kdy 1.6.2000 v účinnost vstoupil nový zákon o ochraně osobních údajů [3], snad poznamenejme, že povinnosti správce i zpracovatele ve vztahu k subjektům údajů jsou tak rozsáhlé, že by s udržením legality zpracovávání tohoto jediného údaje byly spojeny náklady, které by mnohořádově přesáhly jeho cenu.

Podle § 88 odst. 3 bylo MŠMT zmocněno stanovit strukturu informační věty provozované databáze (myšleno matrika studentů na konkrétní vysoké škole) po projednání s vysokou školou. S ohledem na SIMS MŠMT této své pravomoci de facto nevyužilo a omezilo se pouze na definici přenosové datové struktury a stanovení podmínek předávání těchto dat.

Přímo ze zákona [1] vyplývá, že počínaje datem 1.1.1999 musí matriky studentů vysokých škol, a tedy i sdružená matrika, obsahovat údaje o všech studentech zapsaných do některého studijního programu, a to vždy za celou dobu jejich daného studia.
Základní informační jednotkou matriky jsou data o studentovi ve spojení se studijním programem, který studuje na dané škole/fakultě. Pro automatizovaný sběr dat do sdružené matriky jsou tato data linearizována tak, že jeden záznam předávaný mezi vysokými školami a MŠMT je záznamem jedné etapy historie konkrétního studia konkrétního studenta na konkrétní vysoké škole. Položky záznamu matriky tedy tvoří tři okruhy: údaje o studentovi jako osobě, údaje o studiu a údaje o etapě historie studia.

Student je identifikován svým rodným číslem, což s sebou samozřejmě nese všechny problémy tradičně spojené s fenoménem rodného čísla, včetně problému identifikace  studentů-cizinců, zejména těch, kteří si své studium v ČR financují sami. Osobní údaje o studentovi dále povinně obsahují příjmení, kód okresu bydliště, kód státu a kód předchozího vzdělání – poslední tři údaje jsou nutné pro základní výstupy SIMS.
Studium je identifikováno rodným číslem studenta, kódem vysoké školy (fakulty), kódem studijního programu a datem zahájení studia. Povinnými údaji o studiu (opět s ohledem na předepsané základní výstupy SIMS) jsou typ studijního programu a délka studia, dále údaj o tom, zda je student z pohledu financování klasifikován jako nově přijatý, a konečně údaj o tom, zda a s jakým výsledkem žádal o ubytování v koleji.
Etapa historie studia představuje souvislý časový úsek, v němž nedošlo ke změnám těch atributů studia, které jsou významné z pohledu statistik a financování (jako jsou přerušení studia a návrat po přerušení, změna formy studia nebo změna způsobu financování), a tedy musí být do sdružené matriky zaznamenány. Je identifikována klíčovými údaji o studiu a datem zahájení etapy historie studia. K této pětici klíčových údajů jsou dalšími povinnými údaji kvalifikátor státního občanství, kód obce místa výuky, forma studia, způsob financování a údaj o přerušení studia.

4. Principy řešení

4.1. Lokální sběr a údržba informací
Vysoké školy udržují informace o studentech ve svých nezávislých informačních systémech. Tato (lokální) vrstva je tedy plně v režii a zodpovědnosti vysokých škol – sdružená matrika pouze určuje její minimální informační obsah.

4.2. Export dat a přenos dat
Pro předávání dat je mezi lokálními studijními systémy vysokých škol a systémem SIMS definováno jednotné rozhraní – jednotným předávacím formátem je textový soubor se závazně definovanou strukturou, datovým obsahem a formátem. Významově jeden záznam odpovídá jedné etapě historie studia studenta na vysoké škole (viz předchozí část Data matriky), položkami záznamů jsou atributy historie studia. Při sběru dat vysoké školy exportují matriční data ze svých databází do tohoto formátu, z důvodu bezpečnosti a autenticity přenosový soubor s exportovanými daty povinně digitálně podepisují a šifrují (PGP) a soubor pak ukládají v předem stanoveném termínu na server SIMS.

4.3. Centrální zpracování získaných dat
Po uložení dat matriky vysoké školy se na serveru SIMS ověřuje jejich správnost. V prvním kroku se ověřuje digitální podpis a dešifruje poslaný soubor. Následuje sekvenční kontrola, při níž se postupně kontrolují všechny položky každého záznamu v souboru – vzájemně mezi sebou v rámci příslušného záznamu. Poslední je křížová kontrola, při níž se kontrolují záznamy v souboru jednak vzájemně mezi sebou, jednak vůči již existujícím aktuálním záznamům SIMS.

4.4. Aktualizace databáze SIMS a výpočet přidaných položek
Po kontrolách se centrální databáze SIMS aktualizuje (pouze) těmi záznamy, které úspěšně prošly všemi testy. Aktualizace se provádí až po ukončení sběru, tedy poté, co všechny vysoké školy v závazné lhůtě uložily do sběrné databáze na serveru SIMS data o svých studentech. Nad aktualizovanou centrální databází SIMS se následně dopočítají další doplňující položky, nutné pro zpracování předepsaných výstupů.

4.5. Generování výstupů a prezentace výsledků
Výstupy generované z dat sdružené matriky lze rozdělit na statické (vygenerované po každém novém sběru podle předem stanovených pravidel) a dynamické (generované na požádání). Dynamické výstupy s výhodou umožňují uživateli zadávat různé výběrové podmínky nebo parametry, jimiž ovlivňuje rozsah a uspořádání výstupního přehledu. Výsledné sestavy jsou buď generovány do formátu HTML a prezentovány webovým prohlížečem, nebo jsou předávány v textovém formátu programu MS Excel, který se automaticky spouští k prezentaci a zpracování dalších sestav.

5. Výstupy matriky a uživatelé
Požadované výstupy ze sdružené matriky spolu s formulací zákona [1] určují rozsah povinných údajů předávaných z vysokých škol. Základní předepsané výstupy ze sdružené matriky jsou obsahově trojí: přehledy o ubytování v kolejích, volitelné statistické přehledy a zejména přehledy pro financování studijních programů VŠ.

Oprávněnými klienty SIMS jsou uživatelé zodpovědní za lokální matriky vysokých škol, dále provozovatelé SIMS z MŠMT a konečně správce zajišťující chod celého systému SIMS.
Základní princip technické realizace systému tvoří webová architektura, vyžadující na straně klienta pouze webový prohlížeč podporující protokol HTTPS. Klienti se pomocí prohlížeče připojují k web serveru, autentikují se a následně je jim k dispozici diferencované menu nabídek akcí určené mírou jejich oprávnění. Úvodní distribuce přihlašovacích jmen a hesel a výměna otisků klíčů PGP proběhla oficiální písemnou cestou mezi MŠMT a rektory VŠ.

6. Výhledy SIMS
Implementace projektu SIMS byla ověřena dvěma testovacími sběry dat v červnu a v září 1999. V listopadu 1999 a lednu 2000 proběhly ostré sběry dat (v prvním byla sbírána celá historie matrik studentů platná k 31.10.1999, ve druhém přírůstková historie k 31.12.1999). Všech 23 vysokých škol ČR uložilo do SIMS kopie svých matrik.
První etapa projektu SIMS byla uzavřena k 31.8.1999. 6.1.2000 byly MŠMT ČR předány ze SIMS zpracované souborné podklady pro stanovení rozpočtu vysokých škol pro rok 2000 (analogie výkazu V11-01). V únoru 2000 byly zpracovány statistiky absolventů VŠ v roce 1999 (analogie výkazu V12-01).
V současné době je systém rozšiřován

V květnu 2000 byly ze SIMS zpracovány úvodní podklady určené pro přípravu rozpočtu vysokých škol ČR v roce 2001.
Diskuse k SIMS probíhá jednak neveřejně v prostředí serveru SIMS, jednak lze připomínky a dotazy posílat na adresy sims@msmt.cz a sims@ics.muni.cz.
 
 

Literatura
[1] Zákon č. 111/1998 Sb., o vysokých školách a o změně a doplnění dalších zákonů (o vysokých školách)
[2] Zákon č. 256/1992 Sb., o ochraně osobních údajů v informačních systémech
[3] Zákon č. 101/2000 Sb., o ochraně osobních údajů a o změně některých zákonů
 
 

RNDr. Mgr. Vladimír Šmíd, CSc., 1960, matematik, informatik a právník;
matematik-analytik Ústavu výpočetní techniky MU (1984-1995), vedoucí Útvaru systémového řízení a organizace MU (od 1995), odborný asistent Katedry informačních technologií Fakulty informatiky MU (od 1995);
Masarykova univerzita v Brně, rektorát, Žerotínovo nám. 9, 601 77 Brno, Česká republika
smid@rect.muni.cz

RNDr. Jana Kohoutková, informatik; od roku 1996 vedoucí skupiny WWW a multimédia v Ústavu výpočetní techniky MU Brno; odborné zaměření: integrace distribuovaných heterogenních informačních zdrojů.
Masarykova univerzita v Brně, Ústav výpočetní techniky, Botanická 68a, 602 00 Brno, Česká republika
jkoh@ics.muni.cz