Identifikační kód | RIV/00216224:14330/11:00051703 |
Název v původním jazyce | Vyhledávání a analýza popisujících výjezdy hasičského záchranného sboru |
Název v anglickém jazyce | Retrieval and analysis of reports on a fire brigade operations |
Druh | D - Článek ve sborníku |
Jazyk | cze - čeština |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2011 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 3 |
Výčet všech uvedených jednotlivých tvůrců | Jan Géryk (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 8411867) Jaroslav Bayer (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9897690) Lubomír Popelínský (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9343199) |
Popis výsledku v původním jazyce | Článek se zabývá problematikou dohledávání textů na internetu dle informací o výjezdech hasičského záchranného sboru a následnou klasifikací získaných textů do různých kategorií. Databáze výjezdů obsahovala celkem 116 000 záznamů. Vybrali jsme 4110 záznamů podle závažnosti zásahu a pokusili se dohledat odpovídající texty na internetu. Úspěšní jsme byli v 2956 případech. Popisujeme metodu sběru textů a dolování ze získané textové informace. Nejvyšší celková správnost klasifikace textů do tříd dle typů výjezdu dosáhla 84 %, a podle geografického členění do krajů 60 %. Diskutujeme vhodnost různých metod strojového učení a vhodnost či nevhodnost lematizace. |
Popis výsledku v anglickém jazyce | Retrieval and analysis of reports on a fire brigade operations. The article deals with the searching of texts on the internet based on the information obtained from the firemen database. The goal is to classify texts into several categories. We describethe methods of text collection and text mining. The highest overall classification accuracy - by the type of incident and geographic situation - reaches 86 % and 96 %. The given database consists of more than 116,000 records. We have tried to search anddownload texts describing about 4,000 selected events. We have succeeded in more than 2,900 cases. |
Klíčová slova oddělená středníkem | machine learning; data mining; fireman brigade; text classification; text preprocessing; lemmatization |
Stránka www, na které se nachází výsledek | - |