Závěrečná zpráva o řešení projektu

Databáze sdružených informací

M A T R I K   S T U D E N T Ů

 
 
 

Řešitel:

Ústav výpočetní techniky Masarykovy univerzity v Brně

 
 


Obsah:

1.  Zadání projektu
1.1.   Požadavky na systém
1.2.   Řešitelský tým
2.  Principy řešení
2.1.   Schéma systému
2.2.   Struktura dat
2.3.   Technické podmínky
2.4.   Bezpečnost
3.  Ověření funkčnosti
4.  Dokumentace
 
 

Brno 31. srpna 1999


1. Zadání projektu

Zadáním typového projektu Databáze sdružených informací matrik studentů (SIMS) bylo realizovat systém pro sběr a zpracování dat z matrik studentů vysokých škol. Jak zdrojová data, tak zpracované statistické, ekonomické aj. výstupy systému měly být diferencovaně přístupné různým skupinám oprávněných uživatelů, výstupy systému byly určeny pro potřeby Ministerstva školství, mládeže a tělovýchovy, resp. Ministerstva obrany nebo Ministerstva vnitra ČR.

Cílem projektu tedy bylo definovat rozhraní mezi zdroji dat (samostatnými informačními systémy vysokých škol) a sdruženou matrikou studentů ČR spravovanou MŠMT, zprůchodnit přenos informací přes tato rozhraní a zajistit jejich snadnou centrální zpracovatelnost a přístupnost.
 

1.1. Požadavky na systém

Výsledný systém měl splňovat několik úrovní požadavků. K obecným patřily:


Uživatelskými požadavky byly:

Administrativními požadavky byly:


1.2. Řešitelský tým (v abecedním pořadí)

Ministerstvo školství, mládeže a tělovýchovy ČR (specifikace požadavků na systém)

            JUDr. Zdeňka Pastorová
            Doc. RNDr. Josef Pospíšil, CSc.

Masarykova univerzita v Brně (projekt, analýza požadavků, koncepce systému, programová realizace)

            RNDr. Jana Kohoutková
            Mgr. Petr Koudelka
            Mgr. Jaroslav Měcháček
            Doc. RNDr. Václav Račanský, CSc. - vedoucí řešitelského týmu MU Brno
              RNDr. Mgr. Vladimír Šmíd, CSc.
 

2. Principy řešení

Implementované řešení je koncipováno jako modelové řešení, obecně aplikovatelné na sběr, zpracování a prezentaci libovolných informací.

Principy řešení jsou:

Vyjmenovanými principy jsou definovány tři základní komponenty celého systému: vzájemně propojené přenosovým prostředím, které je diferencované a individualizované, se zajištěnou ochranou a bezpečností při datových přenosech.

2.1. Schéma systému

2.1.1. Lokální  vrstva

Lokální vrstva je primární datová vrstva, naplňovaná z lokálních datových zdrojů. (Může být realizována buď statickými soubory v definovaném formátu, nebo vhodnou databází s dynamickými exporty do souborů v definovaném jednoduchém formátu.)

Obsah, struktura a formát dat jsou specifikovány jednotně a závazně pro všechny subjekty v systému (tj. všechny vysoké školy) – podrobněji jsou rozebrány v částech 2.1.2. a 2.2.1. Rovněž závazně je určeno místo uložení lokálních souborů na centrálním serveru.
__________________________________________________________________________________
Poznámka:
Datové soubory mohou být uloženy buď na lokálním serveru nebo na centrálním serveru MŠMT, mechanismus sběru je navržen obecně. Z hlediska nezávislosti provozu na lokálních podmínkách se ukazuje jako výhodnější centrální uložení (se zabezpečeným mechanismem přenosu na centrální server).
__________________________________________________________________________________
 

2.1.2. Struktura souborů pro výměnu dat

Pro sjednocení přenášených dat byl definován jednotný výměnný formát a znaková sada. Data jsou předávána v textovém souboru (věty oddělené řádky, položky vět oddělené dohodnutým oddělovačem – podrobněji viz dokumentace [5]), společnou znakovou sadou je ISO-8859-2 (ISO Latin 2).

Struktura dat (struktura informační věty matriky) byla definována podle požadavků a ve spolupráci se zadavatelem projektu SIMS – aktuální definice je podrobně popsána v dokumentaci [1], [2] a [4].
 

2.1.3 Centrální  vrstva

Centrální zpracovatelská vrstva je sekundární vrstvou, v níž se slučují data přenesená z lokálních vrstev. Data jsou strukturována, vzájemně propojena a pro potřeby různých výstupů optimalizována na agregované dotazy. Vrstva je realizována jako relačně restrukturovaná (reindexovaná) centrální databáze matrik studentů, rozšířená o specifická data zabezpečující správu uživatelů a organizaci sběrů dat.

Přenos dat z lokální vrstvy do centrální probíhá přenosovým prostředím, kterým je akademická počítačová síť CESNET, za podmínky zajištěné bezpečnosti a ochrany zpřístupňovaných a přenášených informací (o bezpečnosti podrobněji viz část 2.4.). Uživatelské rozhraní k centrální vrstvě je realizováno službou WWW. V centrální vrstvě je jednak sběrná databáze pro uložení přenesených dat, jednak hlavní centrální databáze.
 

2.1.4. Princip sběru dat (Sběrný klient)

Přenos všech datových souborů z lokální vrstvy do centrální je realizován pomocí centrálního sběrného klienta, který obstarává následující funkce:

V průběhu sběru do sběrné databáze procházejí datové soubory dvojí kontrolou: Kontrolní program pro sekvenční kontrolu mají uživatelé SIMS volně ke stažení a lokálnímu provozování – podrobněji viz [8].
 

2.1.5. Transformace struktury dat (Aktualizační modul)

Struktura dat v přenášených souborech je optimalizována pro plnění a přenos, ale nikoli pro organizaci centrální databáze určené ke složitějším dotazům. Proto jsou data transformována z podoby vhodné pro přenos do sběrné databáze do podoby vhodné pro zpracování výstupů z centrálního systému. Tuto transformaci provádí Aktualizační modul, který tak data předzpracuje pro používání dalšími částmi systému.
 

2.1.6. Prezentační vrstva

Centrální prezentační vrstva představuje uživatelské rozhraní k centrální zpracovatelské vrstvě, na principu diferencovaného přístupu různých skupin uživatelů systému k „jejich“ informacím (vzdáleným síťovým přístupem). Je realizována intranetovou technologií WWW, tj. hypertextovými dokumenty a hypertextovými zadávacími formuláři generovanými pro různé skupiny uživatelů. Bezpečnost a ochrana dat před nežádoucím přístupem ke čtení je zajištěna přiměřeně jejich obsahu a důvěrnosti – protokolem HTTPS.

Prezentační rozhraní plní dvojí funkci:


2.2. Struktura dat

Klíčovým realizačním krokem bylo identifikovat všechny entity, určit jejich vzájemné vztahy a na tomto základě vybudovat datový model. Tímto modelem jsou určeny:


 2.2.1. Struktura zdrojových dat

Výsledná definice struktury zdrojových dat pro systém SIMS vychází ze struktury definované zadavatelem, do níž byly v další společné analýze zahrnuty úpravy. Informační věta pro matriku studentů je definována jako student ve spojení se studijním programem, který studuje na dané škole/fakultě. Podrobně je informační věta spolu s používanými číselníky v dokumentaci SIMS – viz [1], [2] a [4].
 

2.2.2. Struktura centrálních dat

V centrální databázi jsou zdrojová data restrukturována do tří základních entit:

Kromě této základní struktury entit obsahuje centrální databáze strukturu pro správu uživatelů SIMS a strukturu pro řízení systému sběrů dat. V souvislosti s požadavky zadavatele na výstupy byla nutná struktura databáze rozšířena o další specifické položky (viz [3]), naplňované výsledky vlastní činnosti systému SIMS.
 

2.2.3. Struktura prezentačních sestav

Základní uživatelské prezentační sestavy byly definovány podle požadavků zadavatele. Jsou dvojího typu a funkce, jak bylo uvedeno v části 2.1.3., a pokrývají rozsah celé základní struktury centrální databáze. Jsou jimi:

Kromě těchto základních funkčních výstupů poskytuje centrální databáze komplex přehledů o uživatelích systému SIMS a správě sběrů dat SIMS.
 

2.3. Technické podmínky

Hlavními kritérii při výběru technického zabezpečení realizace (hardwarové platformy, operačního systému, databázového systému) byly

Serverem SIMS je PC UNIT P II-350 DUAL v základní konfiguraci podle specifikace zadavatele – podrobněji viz [13]. Operačním systémem je MS Windows NT Server 4.0 (z důvodu relativní stability, ceny a možnosti výběru z rozsáhlého množství aplikací a vývojových nástrojů), databázovým serverem je MS SQL Server 7.0 optimalizovaný na spolupráci s WWW serverem MS IIS.

Centrální sběrná a prezentační vrstva je implementována pomocí programovacího jazyka Visual Basic a technologie Active Server Pages (ASP). V některých částech centrální vrstvy je rovněž použito programovacích jazyků Perl, C++ a TSQL (jazyk SQLServeru).

Na straně uživatele je nezbytný některý z WWW prohlížečů (MS Internet Explorer verze 4.0 nebo vyšší, nebo Netscape Navigator verze 3.0 nebo vyšší). Pro některé uživatele, kteří přebírají výstupy systému k dalšímu zpracování, je potřebný tabulkový procesor MS Excel.
 

2.4. Bezpečnost

2.4.1. Bezpečnost integrační části

Pod bezpečnost integrační části spadá přenos dat lokálních matrik do centrální vrstvy. Rizikům odposlechu přenášených dat nebo pokusů o narušení jejich integrity apod. se zamezuje šifrováním přenášených souborů metodou PGP. Riziku zpochybnění platnosti a původu dat je zamezeno digitálním podpisem (opět metodou PGP), jehož otisk každý subjekt (vysoká škola) předá správcům SIMS v autorizované písemné podobě. Obdobně předá MŠMT autorizovaným způsobem vysokým školám otisk prstu tzv. primárního klíče matriky studentů. Podrobnosti k šifrování a digitálním podpisům PGP jsou uvedeny v dokumentaci SIMS [6].

Součástí zabezpečení systému na této úrovni je pravidelné zálohování a replikace dat i programového vybavení a proškolení správců.
 

2.4.2. Bezpečnost prezentační části

Systém nabízí informační služby, které jsou přístupny pouze vybranému okruhu uživatelů s různou mírou oprávnění. Veškerý přístup k informacím je proto kontrolován, aby je nebylo možno zneužít: počet autorizovaných správců systému je omezen a prezentační vrstva udržuje informace o přístupových právech uživatelů k jednotlivým informačním službám, podle nichž přístup řídí (každý uživatel je autentikován přihlašovacím jménem a heslem, rozsah jeho pravomocí je předem určen). Aby nebylo možno narušit systém odposlechem přenášeného hesla nebo narušit integritu přenášených informací, je pro veškerou komunikaci mezi uživatelovým prohlížečem a (chráněnými) službami systému použit bezpečný protokol HTTPS. (Pro praktický provoz je rovněž doporučeno v budoucnu umístit mezi server se službami systému a vnější internet firewall.)

Přístupová práva uživatele k jednotlivým informačním službám jsou určena:

Všichni uživatelé, u nichž je shodná dvojice subjekt a typ uživatele, patří do společné skupiny. Každá skupina má společná některá data (např. PGP klíč, posílaná data). Existuje-li ve skupině osoba, která má právo správy uživatelů, může tato osoba: vytvářet nové účty, modifikovat přístupová práva a rušit účty ostatním uživatelům skupiny.
 

3. Ověření funkčnosti

Implementace projektu SIMS byla ověřena testovacím sběrem, který proběhl v červnu (sbírána byla data matrik studentů platná k 1. 5. 1999, a to celá historie). Ze 23 vysokých škol ČR se sběru nezúčastnily 4 (vesměs vysoké školy uměleckého zaměření sídlící v Praze). Statistika tohoto testovacího sběru (počty předaných záznamů a výsledky sekvenčních a křížových kontrol) je přístupná na serveru SIMS na adrese:
https://sims.ics.muni.cz/Sims_is/sprava_sberu/provedene_sbery.asp?Id_sberu=1

Druhý testovací sběr pro SIMS proběhne v první polovině září a budou sbírána data platná k 31. 8. 1999, opět v celé historii.
 

4. Dokumentace

Řešení projektu SIMS je zdokumentováno hypertextovými soubory uloženými na serveru SIMS. Dokumentace obsahuje soubory:

[1] Struktura informační věty
        https://sims.ics.muni.cz/Sims_is/datamatriky/Struktura_vety.asp
[2] Rodná čísla studentů-cizinců
        https://sims.ics.muni.cz/Sims_is/datamatriky/RC_cizinci.asp
[3] Přidané položky
        https://sims.ics.muni.cz/Sims_is/dokumentace/pridane_polozky.asp
[4] Číselníky
        https://sims.ics.muni.cz/Sims_is/Ciselniky/
[5] Formát dat
        https://sims.ics.muni.cz/Sims_is/datamatriky/format_dat.asp
[6] PGP
        https://sims.ics.muni.cz/Sims_is/pgp/pgp.asp
[7] Sekvenční kontrola dat matriky
        https://sims.ics.muni.cz/Sims_is/datamatriky/sekvK.asp
[8] Sekvenční test - poznámky k lokálnímu provozování
        https://sims.ics.muni.cz/Sims_is/Sberdat/sekvKProvoz.asp
[9] Křížová kontrola dat matriky
        https://sims.ics.muni.cz/Sims_is/datamatriky/krizK.asp
[10] Standardizované výstupy matriky: Ubytování v kolejích
        https://sims.ics.muni.cz/Sims_is/dokumentace/vystup_ubyt.asp
[11] Standardizované výstupy matriky: Statistické přehledy
        https://sims.ics.muni.cz/Sims_is/dokumentace/vystup_akred.asp
[12] Standardizované výstupy matriky: Financování studijních programů
        https://sims.ics.muni.cz/Sims_is/dokumentace/vystup_financ.asp
[13] Specifikace serveru
        https://sims.ics.muni.cz/Sims_is/dokumentace/server_SIMS.asp