Údaje o výsledku |
Identifikační kód | RIV/00216224:14330/13:00070032 |
Název v původním jazyce | Avoiding Anomalies in Data Stream Learning |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor | IN - Informatika |
Rok uplatnění | 2013 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů |
Počet výskytů výsledku | 1 |
Údaje z Hodnocení výsledků výzkumných organizací 2014 |
Výsledek byl hodnocen v Pilíři I |
Rozsah vyřazení výsledku | Tento výskyt výsledku není vyřazen |
Zařazení výsledku v hodnocení | D - Článek ve sborníku |
Skupina oboru v hodnocení | 04 - Technické a informatické vědy |
Konkrétní způsob(y) hodnocení výsledku | Článek ve sborníku evidovaném v databázi Scopus bodovaný podle SJR zdroje typu Book Series nebo Conference Proceedings |
Bodové ohodnocení | 46,181 |
Faktor korekce | 50,1 % |
Body (upravené podle přílohy č. 8 Metodiky) | 23,141 |
Rozdělení výsledku mezi předkladatele |
Organizace | Výzkumná organizace? | Podíl | Body | Body (upravené podle přílohy č. 8 Metodiky) |
Masarykova univerzita / Fakulta informatiky | ano | 50,0 % | 23,090 | 11,570 |
|
Tvůrci výsledku |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 1 |
Tvůrce | Gama Joao (státní příslušnost: PT - Portugalská republika) |
Tvůrce | Kosina Petr (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 5283485) |
Tvůrce | Almeida Ezilda (státní příslušnost: PT - Portugalská republika) |
Údaje blíže specifikující výsledek |
Popis v původním jazyce | The presence of anomalies in data compromises data quality and can reduce the effectiveness of learning algorithms. Standard data mining methodologies refer to data cleaning as a pre-processing before the learning task. The problem of data cleaning is exacerbated when learning in the computational model of data streams. In this paper we present a streaming algorithm for learning classification rules able to detect contextual anomalies in the data. Contextual anomalies are surprising attribute values in the context defined by the conditional part of the rule. For each example we compute the degree of anomaliness based on the probability of the attribute-values given the conditional part of the rule covering the example. The examples with high degree of anomaliness are signaled to the user and not used to train the classifier. The experimental evaluation in real-world data sets shows the ability to discover anomalous examples in the data. |
Klíčová slova | Data Streams; Rule Learning; Anomaly Detection |
Rozsah stran | 49-63 |
Název sborníku | Discovery Science, Proceedings of 16th International Conference DS 2013 |
Forma vydání | P - Tištěná verze „print“ |
ISSN | 0302-9743 |
Počet stran výsledku | 15 |
ISBN | 9783642408960 |
Název nakladatele | Springer-Verlag |
Místo vydání | Berlin Heidelberg |
Místo konání akce | Singapore |
Datum zahájení akce | 6.10.2013 |
Typ akce podle státní příslušnoti účastníků | WRD - Světová |
Adresa www stránky s výsledkem | http://link.springer.com/chapter/10.1007%2F978-3-642-40897-7_4 |
DOI výsledku | 10.1007/978-3-642-40897-7_4 |
Údaje o tomto záznamu o výsledku |
Předkladatel | Masarykova univerzita / Fakulta informatiky |
Dodavatel | MSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT) |
Rok sběru | 2014 |
Systémové označení dodávky dat | RIV14-MSM-14330___/01:1 |
Specifikace | RIV/00216224:14330/13:00070032!RIV14-MSM-14330___ |
Kontrolní kód | [9D9957BF1D45] |
Jiný výskyt tohoto výsledku se v RIV nenachází |
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl |
Projekt | LG13010 - Zastoupení ČR v European Research Consortium for Informatics and Mathematics (2013-2015, MSM/LG) |
S - Specifický výzkum na vysokých školách |