Projekt z deduktivních a objektově orientovaných databází


Vedoucí: RNDr. Lubomír Popelínský
Zpracovali: František Hanák, Dita Němcová







Popis programu k převádění rozhodovacích stromů do ConceptBase

Program TreeToTable převádí rozhodovací stromy, generované programem c4.5, na instance tříd pro ConceptBase. Je napsaný v ANSI C, zdrojáky k němu a binárky (přeložené pod Solaris) jsou zde.

Vstupem programu je soubor.names (bez přípony), který se má zpracovat programem c4.5. TreeToTable vygeneruje všechny možné kombinace hodnot jednotlivých atributů, ty postupně zapisuje do souboru soubor.names, který nechá zpracovat c4.5, a jeho výstup převede na vstupní soubory ConceptBase, přičemž se ukládá každý vygenerovaný strom, o kterém se uchovávají následující informace:

Samotné rozhodovací stromy se ukládají do externího souboru (buď jednoho - trees.dat - u treetab, nebo do samostatných souborů pojmenovaných jméno_instance.dat u treetab1.

Použití
V aktuálním adresáři musí být program c4.5, soubor.names, soubor.data, soubor.test.
Omezení pro vstupní soubor: soubor.names musí obsahovat prázdný řádek před seznamem atributů.
Máme-li např. ke zpracování c4.5 soubor, který se jmenuje data.names, program se zavolá s argumentem data:
treetab data
resp.
treetab1 data.


Výstupem programu jsou soubory
jmeno_Classes.sml - definice třídy Graph pro ukládání stromů,
jmeno_Instances.sml - instance třídy Graph obsahující údaje z jednotlivých stromů.