PA152: Implementace databázových systémů

Cílem kurzu je seznámit studenty s přístupy k implementaci databázových systémů se zvláštním zřetelem na efektivnost.

Kurz probíhá podle knihy H. Garcia-Molina, J.D. Ullman, and J. Widom. Database System Implementation. Prentice Hall, New Jersey, 2000. (V knihovně FI pod signaturou D89.) Ke knize existují podpůrné stránky.


Projekty

Na zkoušce bude maximální počet bodů 80. V průběhu semestru je možné vypracovat (samostané) projekty, za které může každý student získat až 50 bodů, které se potom započtou do výsledné známky. K úspěšnému absolvování zkoušky je i při započtení libovoného počtu bodů z projektů potřeba získat alespoň 20 bodů z vlastní zkoušky.

Výsledkem projektu je vždy písemná zpráva, v závislosti na typu projektu doplněná o funkční program(y). Projekt dělá student samostatně nebo ve skupině maximálně tří lidí. V případě skupiny musí být ve zprávě jasně řečeno, kdo dělal kterou část. V případě zjištění, že práce není výsledkem předkladatelů, bude ohodnocena -10 body.

Ke známce budou přičteny pouze body za projekty odevzdané před termínem dané zkoušky.

Projekty je možné vybírat zejména z následujícího seznamu, ale samostatná iniciativa typu implementace vlastního DBMS nebo rozšíření stávajícího DBMS o nové algoritmy není vyloučena.

  1. Použitelnost komprese při přenosu větších dat na jiný počítač.
    Jaká je rychlost přenosu při použití různých médií (síť, flash disk, hard disk, CD-RW) s a bez použití kompresních programů? Vyzkoušejte různé počty, velikosti a formáty (texty, obrázky, programy, ...) souborů. Změřte čas, za jak dlouho se přenese zvolené množství dat přímo na jiný počítač, případně časy pro přenos na paměťové médium a z paměťového média. Časy musí zahrnovat i případné použití (de)kompresních programů.
    Maximálně 10 bodů za každé zdokumentované médium
  2. Rychlost dvoufázového třídění s využitím komprese pomocných souborů.

    Maximum 20 bodů
  3. Rychlost dvoufázového třídění s využitím proudového třídění.

    Maximum 20 bodů
  4. Rychlost asembleru oproti C++
    Ověřte, zda vypuštění cyklů použitím asembleru a instrukcí REP, SCAS, BSF urychlí zpracování komprimovaných dat.
    Maximum 30 bodů
  5. Vliv velikosti datových elementů
    Ověřte, zda má velikost paměťového elementu (bajt, slovo, ...) při dekompresi dat vliv na rychlost zpracování.
    Maximum 30 bodů
  6. Sada testových otázek
    Vytvořte sadu testových otázek, které mohou být použity při zkoušce formou testu. Každá otázka musí obsahovat čtyri odpovědi s vyznačenou správnou odpovědí. Otázky posílejte v textovém tvaru.
    Maximum 5 bodů za každou otázku
  7. Názorné ilustrace k přednášce
    Vytvořte názorné ilustrace (obrázky, nákresy, ikony), které mohou být začleněny do studijních materiálů. Ideálním formátem je některý z vektorových formátů, které jsou snadno editovatelné na Linuxu.
    Maximum 5 bodů za každou ilustraci
  8. Výstižné heslo/verš k přednášce
    Navrhněte heslo, verš, říkanku či frázi, která je snadno zapamatovatelná a dobře vystihuje jednu přednášku či její část.
    Maximum 7 bodů za jedno heslo

Přednášky

19. 9. 2008
Úvod: prezentace, tisk, 2 slidy na stránku, 4 slidy na stránku 8 slidů na stránku
26. 9. 2008
Třídění: prezentace, tisk, 2 slidy na stránku, 4 slidy na stránku 8 slidů na stránku
3. 10. 2008
Uložení dat: prezentace, tisk, 2 slidy na stránku, 4 slidy na stránku 8 slidů na stránku
Materiály z roku 2005.
Pavel Rychlý