Identifikační kód | RIV/00216224:14330/15:00083460 |
Název v anglickém jazyce | Acceleration of dRMSD Calculation and Efficient Usage of GPU Caches |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2015 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 3 |
Výčet všech uvedených jednotlivých tvůrců | Jiří Filipovič (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 4842138) Jan Plhák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 2466627) David Střelák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 7032749) |
Popis výsledku v anglickém jazyce | In this paper, we introduce the GPU acceleration of dRMSD algorithm, used to compare different structures of a molecule. Comparing to multithreaded CPU implementation, we have reached 13.4x speedup in clustering and 62.7x speedup in 1:1 dRMSD computationusing mid-end GPU. The dRMSD computation exposes strong memory locality and thus is compute-bound. Along with conservative implementation using shared memory, we have decided to implement variants of the algorithm using GPU caches to maintain memory locality. Our implementation using cache reaches 96.5 % and 91.6 % of shared memory performance on Fermi and Maxwell, respectively. We have identified several performance pitfalls related to cache blocking in compute-bound codes and suggested optimization techniques to improve the performance. |
Klíčová slova oddělená středníkem | RMSD; GPU; code optimization; cache |
Stránka www, na které se nachází výsledek | - |
DOI výsledku | 10.1109/HPCSim.2015.7237020 |