Identifikační kód | RIV/00216224:14330/15:00082481 |
Název v anglickém jazyce | A flexible denormalization technique for data analysis above a deeply-structured relational database: biomedical applications |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2015 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 2 |
Počet domácích tvůrců | 2 |
Výčet všech uvedených jednotlivých tvůrců | Stanislav Štefanič (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, vedidk: 4156439) Matej Lexa (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, vedidk: 6759890) |
Popis výsledku v anglickém jazyce | Relational databases are sometimes used to store biomedical and patient data in large clinical or international projects. This data is inherently deeply structured, records for individual patients contain varying number of variables. When ad-hoc access to data subsets is needed, standard database access tools do not allow for rapid command prototyping and variable selection to create flat data tables. In the context of Thalamoss, an international research project on beta-thalassemia, we developed and experimented with an interactive variable selection method addressing these needs. Our newly-developed Python library sqlAutoDenorm.py automatically generates SQL commands to denormalize a subset of database tables and their relevant records, effectively generating a flat table from arbitrarily structured data. The denormalization process can be controlled by a small number of user-tunable parameters. |
Klíčová slova oddělená středníkem | relational database; PostgreSQL; NoSQL; data flattening; automatic data denormalization |
Stránka www, na které se nachází výsledek | http://link.springer.com/chapter/10.1007%2F978-3-319-16483-0_12 |
DOI výsledku | 10.1007/978-3-319-16483-0_12 |