NUKADA Akira

Researcher's full information

Articles

Cache-aware Sparse Matrix Formats for Kepler GPU
Nagasaka Yusuke; Nukada Akira; Matsuoka Satoshi
20th IEEE International Conference on Parallel and Distributed Systems (ICPADS 2014)/pp.281-288, 2014-12
Efficient Execution of Multiple CUDA Applications using Transparent Suspend, Resume and Migration
Suzuki Taichiro; Nukada Akira; Matsuoka Satoshi
Euro-Par 2015: Parallel Processing. Euro-Par 2015. Lecture Notes in Computer Science/9233/pp.687-699, 2015-08
Adaptive Multi-level Blocking Optimization for Sparse Matrix Vector Multiplication on GPU”, Procedia Computer Science series
Nagasaka Yusuke; Nukada Akira; Matsuoka Satoshi
Procedia Computer Science/80/pp.131-142, 2016-06
High-Performance and Memory-Saving Sparse General Matrix-Matrix Multiplication for NVIDIA Pascal GPU
Nagasaka Yusuke; Nukada Akira; Matsuoka Satoshi
46th International Conference on Parallel Processing (ICPP-2017)/pp.101-110, 2017-08
Optimizations of Compute-bound Scientific Kernels on SW26010 Many-core Processor
Lin James; Xu Zhigeng; Nukada Akira; Maruyama Naoya; Mats...
46th International Conference on Parallel Processing (ICPP-2017)/pp.432-441, 2017-08
Efficient Solving of Scan Primitive on Multi-GPU Systems
Dieguez Adrian Perez; Amor Margarita; Ramón Doallo; Nukad...
32nd IEEE International Parallel and Distributed Processing Symposium (IPDPS 2018)/pp.794-803, 2018-05
Optimizations of Preconditioned Conjugate Gradient on TaihuLight for OpenFOAM
Lin James; Wen Minhua; Meng Delong; Liu Xin; Nukada Akir...
18th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid 2018)/pp.283-290, 2018-05
MRG8 - Random Number Generation for the Exascale Era
Nagasaka Yusuke; Nukada Akira; Matsuoka Satoshi; Miura K...
PASC 2018: Platform for Advanced Scientific Computing Conference, 2018-07
Batched Sparse Matrix Multiplication for Accelerating Graph Convolutional Networks
Nagasaka Yusuke; Nukada Akira; Kojima Ryosuke; Matsuoka ...
19th Annual IEEE/ACM International Symposium in Cluster, Cloud, and Grid Computing (CCGrid 2019)/pp.231-240, 2019-05
CUDA GPU向けの自動最適化FFTライブラリ
額田彰
情報処理学会論文誌コンピューティングシステム(ACS)/2(3)/pp.107-115, 2009-09
APU上の混合精度AMG法
住吉優希 ; 長岡駿希 ; 藤井昭宏 ; 額田彰 ; 田中輝雄
IPSJ SIG Notes/2013(13)/pp.1-7, 2013-09
CiNii
Overview of TSUBAME3.0, Green Cloud Supercomputer for Convergence of HPC, AI and Big-Data
松岡聡; 遠藤敏夫; 額田彰; 三浦信一; 野村哲弘; 佐藤仁; 實本英之; Drozd Aleksandr
Tsubame ESJ. : e-science journal/16/pp.2-8, 2017-11
CiNii
Achievement of Linpack Performance of over 1PFlops on TSUBAME 2.0 Supercomputer
遠藤敏夫; 額田彰; 松岡聡
先進的計算基盤システムシンポジウム論文集/(2011)/pp.373-380, 2011-05
CiNii
ウルトラグリーンスパコンTSUBAME2.5/TSUBAME-KFC
遠藤敏夫; 額田彰; 松岡聡
大学ICT推進協議会年次大会論文集/p.6p, 2013
CiNii
超省エネスーパーコンピューター TSUBAME
遠藤敏夫; 額田彰; 松岡聡
ペトロテック/37(8)/pp.605-609, 2014-08
CiNii
TSUBAME-KFC : the Greenest Supercomputer in the World With Liquid Submersion Cooling
遠藤敏夫; 額田彰; 松岡聡
Tsubame ESJ. : e-science journal/11/pp.2-7, 2014-06
CiNii
Fast fourier transform using GPU
額田彰
Tsubame ESJ./3/pp.27-30, 2011-02
CiNii
Linpack Tuning Method on a Heterogeneous Supercomputer with Hybrid Accelerators
遠藤敏夫; 額田彰; 松岡聡; 丸山直也; Hideyuki Jitsumoto
Proc. Summer United Workshops on Parallel, Distributed and Cooperative Processing, SWoPP2009, Sendai, Aug./2009-HPC-121(3)/pp.1-8, 2009-10
CiNii
Acceleration of Himeno Benchmark on Multi-node GPU System by Overlapping Communication with Calculation : Over 700 GFLOPS of Sustained Performance is Achieved with 32 GPUs
加藤季広; 青木尊之; 額田彰; 遠藤敏夫; 松岡聡; 長谷川篤史
情報処理学会研究報告. [ハイパフォーマンスコンピューティング]/120/pp.C1-C6, 2009-06
CiNii
Linpack Tuning on a Heterogeneous Supercomputer with Four Types of Processors
遠藤敏夫; 額田彰; 松岡聡; 丸山直也; 實本英之
IPSJ SIG Notes/182/pp.13-18, 2009-02
CiNii
Performance Evaluation of Software-Based ECC for GPUs
丸山直也; 額田彰; 松岡聡
IPSJ SIG Notes/2009/pp.25-30, 2009
CiNii
ソフトウェアECCによるGPUメモリの耐故障性の実現と評価
丸山直也; 松岡聡; 尾形康彦; 額田彰; 遠藤敏夫
IEICE technical report/108(181)/pp.9-15, 2008-08
CiNii
High Performance 3-D FFT in CUDA Environment
額田彰; 尾形泰彦; 遠藤敏夫; 松岡聡
情報処理学会論文誌コンピューティングシステム（ACS）/1(2)/pp.231-239, 2008-08
CiNii
Software Framework for GPU Memory Errors
丸山直也; 額田彰; 松岡聡
情報処理学会研究報告. 計算機アーキテクチャ研究会報告/186/pp.H1-H6, 2009-11
CiNii
Power-Aware Task Scheduling on GPU Accelerated Clusters
浜野智明; 額田彰; 遠藤敏夫; 松岡聡
情報処理学会研究報告. [ハイパフォーマンスコンピューティング]/124/pp.Q1-Q9, 2010-02
CiNii
more...