Sdružené informace matrik studentů:

integrace dat pro informační systém veřejné správy

Union Information from Students’ Registers:

Data Integration for the Information System of Public Administration

Jana Kohoutková, Vladimír Šmíd

 
 






The Union Students’ Register is a running project aimed at collecting information from independent university students’ registers into the central information system run by the Czech Ministry of Education – with central processing and presentation providing records about students and studies, and serving budgetary and statistical purposes. The paper describes solution principles, major implementation features, and the outputs of the project – all from the point of view of a unified approach to data integration on the national level of education management.

Keywords: data integration, data standards, education management, differentiated user access, security, credibility

Zákon o vysokých školách [1] s účinností od 1.1.1999 ukládá vysokým školám České republiky povinnost vést matriku studentů, obsahující předepsané základní údaje o jednotlivých studentech zapsaných do studijních programů a určenou k evidenci o studentech a k rozpočtovým a statistickým účelům. Ministerstvo školství, mládeže a tělovýchovy ČR (MŠMT ČR) je oprávněno informace z matrik studentů jednotlivých vysokých škol přebírat a ke stejným účelům využívat. Na základě výběrového řízení, vypsaného MŠMT ČR na podzim 1998, byla realizací projektu Databáze Sdružených Informací Matrik Studentů (SIMS) pověřena Masarykova univerzita v Brně.

Požadavky

Zadáním projektu SIMS bylo vybudovat systém pro sběr a zpracování dat z matrik studentů vysokých škol, v němž jsou jak zdrojová data, tak zpracované výstupy diferencovaně přístupné různým skupinám oprávněných uživatelů, primárně MŠMT ČR.

Cílem projektu tedy bylo definovat rozhraní mezi zdroji dat (samostatnými informačními systémy vysokých škol) a centrálním systémem SIMS, zprůchodnit zabezpečený přenos informací přes tato rozhraní a zajistit jejich centrální zpracování a diferencovanou přístupnost. K obecným požadavkům kladeným na SIMS patřilo i zajištění nepopiratelnosti dat, vzdálená správa systému, plánování integračních a aktualizačních procesů a generování výstupů do vybraných uživatelských nástrojů.

Principy řešení

Lokální sběr a údržba informací
Vysoké školy udržují informace o studentech ve svých nezávislých informačních systémech. Tato (lokální) vrstva je tedy plně v režii a zodpovědnosti vysokých škol – sdružená matrika pouze určuje její minimální informační obsah.

Export dat a přenos dat
Pro předávání dat je mezi lokálními studijními systémy vysokých škol a systémem SIMS definováno jednotné rozhraní – jak datovým obsahem, tak formátem. Jednotným předávacím formátem je textový soubor se závazně definovaným datovým obsahem a strukturou (jednotlivé záznamy na samostatných řádcích, položky záznamů  odděleny dohodnutým oddělovačem, znaková sada ISO Latin 2). Významově jeden záznam odpovídá jedné etapě historie studia studenta na vysoké škole (viz dále část Data matriky), položkami záznamů jsou atributy historie studia. Při sběru dat vysoké školy exportují matriční data ze svých databází do tohoto formátu, z důvodu bezpečnosti a autenticity přenosový soubor s exportovanými daty povinně digitálně podepisují a šifrují a soubor pak ukládají v předem stanoveném termínu na server SIMS.

Centrální zpracování získaných dat
Po uložení dat matriky vysoké školy se na serveru SIMS ověřuje jejich správnost. V prvním kroku se ověřuje digitální podpis a dešifruje poslaný soubor. Následuje sekvenční kontrola, při níž se postupně kontrolují všechny položky každého záznamu v souboru – vzájemně mezi sebou v rámci příslušného záznamu. Poslední je křížová kontrola, při níž se kontrolují záznamy v souboru jednak vzájemně mezi sebou, jednak vůči již existujícím aktuálním záznamům SIMS.

Aktualizace databáze SIMS a výpočet přidaných položek
Po kontrolách se centrální databáze SIMS aktualizuje (pouze) těmi záznamy, které úspěšně prošly všemi testy. Aktualizace se provádí až po ukončení sběru, tedy poté, co všechny vysoké školy v závazné lhůtě uložily do sběrné databáze na serveru SIMS data o svých studentech. Nad aktualizovanou centrální databází SIMS se následně dopočítají další doplňující položky, nutné pro zpracování předepsaných výstupů.

Generování výstupů a prezentace výsledků
Výstupy generované z dat sdružené matriky lze rozdělit na statické (vygenerované po každém novém sběru podle předem stanovených pravidel) a dynamické (generované na požádání). Dynamické výstupy s výhodou umožňují uživateli zadávat různé výběrové podmínky nebo parametry, jimiž ovlivňuje rozsah a uspořádání výstupního přehledu. Výsledné sestavy jsou buď generovány do formátu HTML a prezentovány webovým prohlížečem, nebo jsou předávány v textovém formátu programu MS Excel, který se automaticky spouští k prezentaci a zpracování dalších sestav.

Výstupy matriky

Požadované výstupy ze sdružené matriky spolu s formulací zákona o VŠ určují rozsah povinných údajů předávaných z vysokých škol. Základní předepsané výstupy ze sdružené matriky jsou obsahově trojí: přehledy o ubytování v kolejích, volitelné statistické přehledy a zejména přehledy pro financování studijních programů VŠ.

Statistické přehledy, parametrizovatelné celou řadou atributů ve variabilních hodnotových rozsazích, poskytují souborné informace o počtech vysokoškolských studentů členěné podle škol, studijních programů, typů studijních programů a forem studia a jsou určeny k co nejširšímu využití.

Pro přehledy o financování studijních programů VŠ jsou povinnými matričními údaji vedle kódu státu a kvalifikátoru státního občanství zejména údaj o způsobu financování a údaj o tom, zda je student klasifikován jako nově přijatý k vysokoškolskému studiu v ČR. Platnost posledních dvou údajů se v SIMS centrálně ověřuje.

Přehledy o ubytování v kolejích jsou základem pro dotační politiku MŠMT.

Data matriky

Datem zahájení platnosti zákona o vysokých školách je určeno, že počínaje datem 1.1.1999 musí matriky studentů vysokých škol, a tedy i sdružená matrika, obsahovat údaje o všech studentech zapsaných do některého studijního programu.

Základní informační jednotkou matriky jsou data o studentovi ve spojení se studijním programem, který studuje na dané škole/fakultě. Pro automatizovaný sběr dat do sdružené matriky jsou tato data linearizována tak, že jeden záznam předávaný mezi vysokými školami a MŠMT ČR je záznamem jedné etapy historie konkrétního studia konkrétního studenta na konkrétní vysoké škole. Položky záznamu matriky tedy tvoří tři okruhy: údaje o studentovi jako osobě, údaje o studiu a údaje o etapě historie studia.

Student je identifikován svým rodným číslem, což s sebou samozřejmě nese všechny problémy tradičně spojené s fenoménem rodného čísla, včetně problému identifikace  studentů-cizinců, zejména těch, kteří si své studium v ČR financují sami. Osobní údaje o studentovi dále povinně obsahují příjmení, kód okresu bydliště, kód státu a kód předchozího vzdělání – poslední tři údaje jsou nutné pro základní výstupy SIMS.

Studium je identifikováno rodným číslem studenta, kódem vysoké školy (fakulty), kódem studijního programu a datem zahájení studia. Povinnými údaji o studiu (opět s ohledem na předepsané základní výstupy SIMS) jsou typ studijního programu a délka studia, dále údaj o tom, zda je student z pohledu financování klasifikován jako nově přijatý, a konečně údaj o tom, zda a s jakým výsledkem žádal o ubytování v koleji.

Etapa historie studia představuje souvislý časový úsek, v němž nedošlo ke změnám těch atributů studia, které jsou významné z pohledu statistik a financování (jako jsou přerušení studia a návrat po přerušení, změna formy studia nebo změna způsobu financování), a tedy musí být do sdružené matriky zaznamenány. Je identifikována klíčovými údaji o studiu a datem zahájení etapy historie studia. K této pětici klíčových údajů jsou dalšími povinnými údaji kvalifikátor státního občanství, kód obce místa výuky, forma studia, způsob financování a údaj o přerušení studia.

Technická realizace

Základní princip technické realizace systému SIMS tvoří webová architektura se svou nedocenitelnou předností – klientskou dostupností:

Oprávněnými klienty SIMS jsou uživatelé zodpovědní za lokální matriky vysokých škol, dále provozovatelé SIMS z MŠMT a konečně správce zajišťující chod celého systému SIMS.

Na straně klienta je nutný pouze webový prohlížeč podporující protokol HTTPS: klienti se pomocí něj připojují k web serveru, autentikují se a následně je jim k dispozici diferencované menu nabídek akcí určené mírou jejich oprávnění. Úvodní distribuce přihlašovacích jmen a hesel a výměna otisků klíčů PGP proběhla oficiální písemnou cestou mezi MŠMT a rektory VŠ.

Veškerou komunikaci s klienty zajišťuje web server (v případě SIMS MS IIS 4.0). O provádění jednodušších akcí se stará prezentační logika (skripty uživatelského rozhraní mezi klientem a systémem SIMS, napsané v jazycích VBScript a PerlScript a využívající technologie ASP). Složitější a náročnější činnosti SIMS – zejména provádění kontrol, aktualizaci dat, zálohování systému a podobně – obstarává aplikační logika (implementovaná v programovacích jazycích Visual Basic, C++, Perl a TSQL).

Nejdůležitější vrstvou je samozřejmě databáze, obsahující veškerá matriční data studentů a informace nutné pro běh a správu systému – v případě SIMS SQL Server 7.0.

Výhledy SIMS

Implementace projektu SIMS byla ověřena dvěma testovacími sběry dat v červnu a v září 1999. V listopadu 1999 a lednu 2000 proběhly ostré sběry dat (v prvním byla sbírána celá historie matrik studentů platná k 31.10.1999, ve druhém přírůstková historie k 31.12.1999). Všech 23 vysokých škol ČR uložilo do SIMS kopie svých matrik.

První etapa projektu SIMS byla uzavřena k 31.8.1999. V současné době je systém rozšiřován o zpětný tok dat, tj. výstupy určené pro potřeby vysokých škol – přístup školy k informacím, které do sdružené matriky předala (včetně vybraných souvisejících informací), a také přístup jednotlivce k údajům, jež jsou o něm v SIMS vedeny.

Diskuse k SIMS probíhá jednak neveřejně v prostředí serveru SIMS, jednak lze připomínky a dotazy posílat na adresy sims@msmt.cz a sims@ics.muni.cz.

Abstrakt

Projekt „Sdružené informace matrik studentů“ je zaměřen na sběr informací z nezávislých matrik studentů jednotlivých vysokých škol ČR do celostátního informačního systému provozovaného Ministerstvem školství ČR – s následným centrálním zpracováním a prezentací výstupů specifickým třídám oprávněných uživatelů. Příspěvek popisuje principy řešení, podstatné rysy implementace a existující i plánované výstupy projektu, navrženého a implementovaného jako modelové řešení integrace dat, ověřené na oblasti řízení školství ČR.

Literatura

1. Zákon č. 111/1998 Sb., o vysokých školách a o změně a doplnění dalších zákonů (o vysokých školách)
2. Jeffery, K.G., Lay, J.O., Miquel, J.F., Zardan, S., Naldi, F., Vannini Parenti, I.: IDEAS: A System for International Data Exchange and Access for Science. Information Processing and Management 25(6), 1989, 703-711.
3. Skoupý, K., Kohoutková, J., Benešovský, M., Jeffery, K.G.: HYPERMEDATA Approach: A Way to Systems Integration. In Proc. of ADBIS'99. Maribor : University of Maribor, 1999, 9-15. ISBN 86-435-0285-5.
4. Šmíd, V.: Český Informační zákon. Computerworld, Praha : International Data Group, 1997, 18, s. 1-4. 1997. Seriál Bezpečnost pro všechny, soukromí pro každého.
5. Šmíd, V.: Systém zpracování informací pro řídící sféru vysoké školy. In Sborník z 3. letní školy Informační systémy a jejich aplikace. Brno : VUT, FAST, 1994.
 

RNDr. Jana Kohoutková, informatik; od roku 1996 vedoucí skupiny WWW a multimédia v Ústavu výpočetní techniky MU Brno; odborné zaměření: integrace distribuovaných
heterogenních informačních zdrojů.
Masarykova univerzita v Brně, Ústav výpočetní techniky, Botanická 68a, 602 00 Brno, Česká republika
jkoh@rect.muni.cz

RNDr. Mgr. Vladimír Šmíd, CSc., 1960, matematik, informatik a právník;
matematik-analytik Ústavu výpočetní techniky MU (1984-1995), vedoucí Útvaru systémového řízení a organizace MU (od 1995), odborný asistent Katedry informačních technologií Fakulty informatiky MU (od 1995);
Masarykova univerzita v Brně, rektorát, Žerotínovo nám. 9, 601 77 Brno, Česká republika
smid@rect.muni.cz