Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1516 D 483.051183.051
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Acceleration of dRMSD Calculation and Efficient Usage of GPU Caches (2015)výskyt výsledku

Identifikační kódRIV/00216224:14330/15:00083460
Název v anglickém jazyceAcceleration of dRMSD Calculation and Efficient Usage of GPU Caches
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2015
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem3
Počet domácích tvůrců3
Výčet všech uvedených jednotlivých tvůrcůJiří Filipovič (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 4842138)
Jan Plhák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 2466627)
David Střelák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 7032749)
Popis výsledku v anglickém jazyceIn this paper, we introduce the GPU acceleration of dRMSD algorithm, used to compare different structures of a molecule. Comparing to multithreaded CPU implementation, we have reached 13.4x speedup in clustering and 62.7x speedup in 1:1 dRMSD computationusing mid-end GPU. The dRMSD computation exposes strong memory locality and thus is compute-bound. Along with conservative implementation using shared memory, we have decided to implement variants of the algorithm using GPU caches to maintain memory locality. Our implementation using cache reaches 96.5 % and 91.6 % of shared memory performance on Fermi and Maxwell, respectively. We have identified several performance pitfalls related to cache blocking in compute-bound codes and suggested optimization techniques to improve the performance.
Klíčová slova oddělená středníkemRMSD; GPU; code optimization; cache
Stránka www, na které se nachází výsledek-
DOI výsledku10.1109/HPCSim.2015.7237020

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuProceedings of IEEE International Conference on High Performance Computing & Simulation
ISBN9781467378123
ISSN-
Počet stran výsledku8
Strana od-do47-54
Název nakladateleIEEE
Místo vydáníneuveden
Místo konání akceAmsterdam, The Nederlands
Datum konání akce2015
Typ akce podle státní příslušnosti účastníkůWRD - Celosvětová
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2016
SpecifikaceRIV/00216224:14330/15:00083460!RIV16-MSM-14330___
Datum poslední aktualizace výsledku24.05.2016
Kontrolní číslo191635916

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu EEEE2.3.30.0037 - Zaměstnáním nejlepších mladých vědců k rozvoji mezinárodní spolupráce (2013 - 2015)