NUKADA Akira
- Articles
- Batched Sparse Matrix Multiplication for Accelerating Graph Convolutional Networks
Nagasaka Yusuke; Nukada Akira; Kojima Ryosuke; Matsuoka ...
19th Annual IEEE/ACM International Symposium in Cluster, Cloud, and Grid Computing (CCGrid 2019)/pp.231-240, 2019-05 - CUDA GPU向けの自動最適化FFTライブラリ
額田 彰
情報処理学会論文誌コンピューティングシステム(ACS)/2(3)/pp.107-115, 2009-09 - APU上の混合精度AMG法
住吉優希 ; 長岡駿希 ; 藤井昭宏 ; 額田彰 ; 田中輝雄
IPSJ SIG Notes/2013(13)/pp.1-7, 2013-09 - Overview of TSUBAME3.0, Green Cloud Supercomputer for Convergence of HPC, AI and Big-Data
松岡 聡; 遠藤 敏夫; 額田 彰; 三浦 信一; 野村 哲弘; 佐藤 仁; 實本 英之; Drozd Aleksandr
Tsubame ESJ. : e-science journal/16/pp.2-8, 2017-11 - Achievement of Linpack Performance of over 1PFlops on TSUBAME 2.0 Supercomputer
遠藤 敏夫; 額田 彰; 松岡 聡
先進的計算基盤システムシンポジウム論文集/(2011)/pp.373-380, 2011-05 - ウルトラグリーンスパコンTSUBAME2.5/TSUBAME-KFC
遠藤 敏夫; 額田 彰; 松岡 聡
大学ICT推進協議会年次大会論文集/p.6p, 2013 - 超省エネスーパーコンピューター TSUBAME
遠藤 敏夫; 額田 彰; 松岡 聡
ペトロテック/37(8)/pp.605-609, 2014-08 - TSUBAME-KFC : the Greenest Supercomputer in the World With Liquid Submersion Cooling
遠藤 敏夫; 額田 彰; 松岡 聡
Tsubame ESJ. : e-science journal/11/pp.2-7, 2014-06 - Fast fourier transform using GPU
額田 彰
Tsubame ESJ./3/pp.27-30, 2011-02 - Linpack Tuning Method on a Heterogeneous Supercomputer with Hybrid Accelerators
遠藤 敏夫; 額田 彰; 松岡 聡; 丸山 直也; Hideyuki Jitsumoto
Proc. Summer United Workshops on Parallel, Distributed and Cooperative Processing, SWoPP2009, Sendai, Aug./2009-HPC-121(3)/pp.1-8, 2009-10 - Acceleration of Himeno Benchmark on Multi-node GPU System by Overlapping Communication with Calculation : Over 700 GFLOPS of Sustained Performance is Achieved with 32 GPUs
加藤 季広; 青木 尊之; 額田 彰; 遠藤 敏夫; 松岡 聡; 長谷川 篤史
情報処理学会研究報告. [ハイパフォーマンスコンピューティング]/120/pp.C1-C6, 2009-06 - Linpack Tuning on a Heterogeneous Supercomputer with Four Types of Processors
遠藤 敏夫; 額田 彰; 松岡 聡; 丸山 直也; 實本 英之
IPSJ SIG Notes/182/pp.13-18, 2009-02 - Performance Evaluation of Software-Based ECC for GPUs
丸山直也; 額田 彰; 松岡 聡
IPSJ SIG Notes/2009/pp.25-30, 2009 - ソフトウェアECCによるGPUメモリの耐故障性の実現と評価
丸山 直也; 松岡 聡; 尾形 康彦; 額田 彰; 遠藤 敏夫
IEICE technical report/108(181)/pp.9-15, 2008-08 - High Performance 3-D FFT in CUDA Environment
額田 彰; 尾形 泰彦; 遠藤 敏夫; 松岡 聡
情報処理学会論文誌コンピューティングシステム(ACS)/1(2)/pp.231-239, 2008-08 - Software Framework for GPU Memory Errors
丸山 直也; 額田 彰; 松岡 聡
情報処理学会研究報告. 計算機アーキテクチャ研究会報告/186/pp.H1-H6, 2009-11 - Power-Aware Task Scheduling on GPU Accelerated Clusters
浜野 智明; 額田 彰; 遠藤 敏夫; 松岡 聡
情報処理学会研究報告. [ハイパフォーマンスコンピューティング]/124/pp.Q1-Q9, 2010-02 - Optimization of electric power efficiecy based on model in GPU
長坂 仁; 丸山 直也; 額田 彰; 遠藤 敏夫; 松岡 聡
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)/2010-HPC-128(5)/pp.1-6, 2010-12 - Performance Evaluation of TSUBAME 2.0 Heterogeneous Supercomputer with Linpack Benchmark
遠藤 敏夫; 額田 彰; 松岡 聡
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)/2010-HPC-128(5)/pp.1-6, 2010-12 - Achievement of Linpack Performance of over 1PFlops on TSUBAME 2.0 Supercomputer
遠藤 敏夫; 額田 彰; 松岡 聡
情報処理学会論文誌コンピューティングシステム(ACS)/4(4)/pp.169-179, 2011-10 - Operation of TSUBAME 2.0 Green Supercomputer dealing with Power Crisis
遠藤 敏夫; 松岡 聡; 額田 彰; 長坂 真路; 四津 匡康
研究報告ハイパフォーマンスコンピューティング(HPC)/2011(12)/pp.1-9, 2011-11 - Fine Grain Parallel Implementation of Sparse Matrix Algorithms and its Optimization
西田 晃; 額田 彰; 小柳 義夫
IPSJ SIG Notes/91/pp.37-42, 2002-08 - Performance Evaluation of Commodity Distributed Shared Memory IBM x440
西田 晃; 額田 彰; 小柳 義夫
IPSJ SIG Notes/93/pp.31-36, 2003-03 - Parallel Implementation of FFT Algorithms on Distributed Shared Memory Architecture and Its Optimization
額田 彰; 西田 晃; 小柳 義夫
情報処理学会論文誌コンピューティングシステム(ACS)/44(6)/pp.1-8, 2003-05 - Evaluating the SW26010 Many-core Processor with a Micro-benchmark Suite for Performance Optimizations
Lin James; Xu Zhigeng; Cai Linjin; Nukada Akira; Matsuoka...
Parallel Computing/77/pp.128-143, 2018-09 - more...
- Batched Sparse Matrix Multiplication for Accelerating Graph Convolutional Networks