NUKADA Akira
- Articles
- Optimizations of Compute-bound Scientific Kernels on SW26010 Many-core Processor
Lin James; Xu Zhigeng; Nukada Akira; Maruyama Naoya; Mats...
46th International Conference on Parallel Processing (ICPP-2017)/pp.432-441, 2017-08 - Efficient Solving of Scan Primitive on Multi-GPU Systems
Dieguez Adrian Perez; Amor Margarita; Ramón Doallo; Nukad...
32nd IEEE International Parallel and Distributed Processing Symposium (IPDPS 2018)/pp.794-803, 2018-05 - Optimizations of Preconditioned Conjugate Gradient on TaihuLight for OpenFOAM
Lin James; Wen Minhua; Meng Delong; Liu Xin; Nukada Akir...
18th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid 2018)/pp.283-290, 2018-05 - MRG8 - Random Number Generation for the Exascale Era
Nagasaka Yusuke; Nukada Akira; Matsuoka Satoshi; Miura K...
PASC 2018: Platform for Advanced Scientific Computing Conference, 2018-07 - Batched Sparse Matrix Multiplication for Accelerating Graph Convolutional Networks
Nagasaka Yusuke; Nukada Akira; Kojima Ryosuke; Matsuoka ...
19th Annual IEEE/ACM International Symposium in Cluster, Cloud, and Grid Computing (CCGrid 2019)/pp.231-240, 2019-05 - CUDA GPU向けの自動最適化FFTライブラリ
額田 彰
情報処理学会論文誌コンピューティングシステム(ACS)/2(3)/pp.107-115, 2009-09 - APU上の混合精度AMG法
住吉優希 ; 長岡駿希 ; 藤井昭宏 ; 額田彰 ; 田中輝雄
IPSJ SIG Notes/2013(13)/pp.1-7, 2013-09 - Overview of TSUBAME3.0, Green Cloud Supercomputer for Convergence of HPC, AI and Big-Data
松岡 聡; 遠藤 敏夫; 額田 彰; 三浦 信一; 野村 哲弘; 佐藤 仁; 實本 英之; Drozd Aleksandr
Tsubame ESJ. : e-science journal/16/pp.2-8, 2017-11 - Achievement of Linpack Performance of over 1PFlops on TSUBAME 2.0 Supercomputer
遠藤 敏夫; 額田 彰; 松岡 聡
先進的計算基盤システムシンポジウム論文集/(2011)/pp.373-380, 2011-05 - ウルトラグリーンスパコンTSUBAME2.5/TSUBAME-KFC
遠藤 敏夫; 額田 彰; 松岡 聡
大学ICT推進協議会年次大会論文集/p.6p, 2013 - 超省エネスーパーコンピューター TSUBAME
遠藤 敏夫; 額田 彰; 松岡 聡
ペトロテック/37(8)/pp.605-609, 2014-08 - TSUBAME-KFC : the Greenest Supercomputer in the World With Liquid Submersion Cooling
遠藤 敏夫; 額田 彰; 松岡 聡
Tsubame ESJ. : e-science journal/11/pp.2-7, 2014-06 - Fast fourier transform using GPU
額田 彰
Tsubame ESJ./3/pp.27-30, 2011-02 - Linpack Tuning Method on a Heterogeneous Supercomputer with Hybrid Accelerators
遠藤 敏夫; 額田 彰; 松岡 聡; 丸山 直也; Hideyuki Jitsumoto
Proc. Summer United Workshops on Parallel, Distributed and Cooperative Processing, SWoPP2009, Sendai, Aug./2009-HPC-121(3)/pp.1-8, 2009-10 - Acceleration of Himeno Benchmark on Multi-node GPU System by Overlapping Communication with Calculation : Over 700 GFLOPS of Sustained Performance is Achieved with 32 GPUs
加藤 季広; 青木 尊之; 額田 彰; 遠藤 敏夫; 松岡 聡; 長谷川 篤史
情報処理学会研究報告. [ハイパフォーマンスコンピューティング]/120/pp.C1-C6, 2009-06 - Linpack Tuning on a Heterogeneous Supercomputer with Four Types of Processors
遠藤 敏夫; 額田 彰; 松岡 聡; 丸山 直也; 實本 英之
IPSJ SIG Notes/182/pp.13-18, 2009-02 - Performance Evaluation of Software-Based ECC for GPUs
丸山直也; 額田 彰; 松岡 聡
IPSJ SIG Notes/2009/pp.25-30, 2009 - ソフトウェアECCによるGPUメモリの耐故障性の実現と評価
丸山 直也; 松岡 聡; 尾形 康彦; 額田 彰; 遠藤 敏夫
IEICE technical report/108(181)/pp.9-15, 2008-08 - High Performance 3-D FFT in CUDA Environment
額田 彰; 尾形 泰彦; 遠藤 敏夫; 松岡 聡
情報処理学会論文誌コンピューティングシステム(ACS)/1(2)/pp.231-239, 2008-08 - Software Framework for GPU Memory Errors
丸山 直也; 額田 彰; 松岡 聡
情報処理学会研究報告. 計算機アーキテクチャ研究会報告/186/pp.H1-H6, 2009-11 - Power-Aware Task Scheduling on GPU Accelerated Clusters
浜野 智明; 額田 彰; 遠藤 敏夫; 松岡 聡
情報処理学会研究報告. [ハイパフォーマンスコンピューティング]/124/pp.Q1-Q9, 2010-02 - Optimization of electric power efficiecy based on model in GPU
長坂 仁; 丸山 直也; 額田 彰; 遠藤 敏夫; 松岡 聡
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)/2010-HPC-128(5)/pp.1-6, 2010-12 - Performance Evaluation of TSUBAME 2.0 Heterogeneous Supercomputer with Linpack Benchmark
遠藤 敏夫; 額田 彰; 松岡 聡
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)/2010-HPC-128(5)/pp.1-6, 2010-12 - Achievement of Linpack Performance of over 1PFlops on TSUBAME 2.0 Supercomputer
遠藤 敏夫; 額田 彰; 松岡 聡
情報処理学会論文誌コンピューティングシステム(ACS)/4(4)/pp.169-179, 2011-10 - Operation of TSUBAME 2.0 Green Supercomputer dealing with Power Crisis
遠藤 敏夫; 松岡 聡; 額田 彰; 長坂 真路; 四津 匡康
研究報告ハイパフォーマンスコンピューティング(HPC)/2011(12)/pp.1-9, 2011-11 - more...
- Optimizations of Compute-bound Scientific Kernels on SW26010 Many-core Processor