Tensorコア
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/06/27 07:33 UTC 版)
![]() | この記事はカテゴライズされていないか、不十分です。 |
![]() |
Tensorコア(英: Tensor Cores)はNVIDIAが開発する混合精度行列積和アクセラレータである[1]。2017年、データセンター用GPU「Tesla V100」(Volta世代)に初めて搭載された。GeforceとQuadroにはRTXシリーズ(Turing世代)で初めて搭載された。
概要
高い並列計算能力をもったグラフィックス専用の処理ユニットであるGPUは、その並列計算特性が着目され現在ではHPCなど様々な分野で並列計算機として利用されている(GPGPU)。用途が広がるにつれ、深層学習をはじめとする一部の計算では高い数値計算精度よりも高い演算速度が求められることがわかってきた。NVIDIA GeForceシリーズをはじめとした様々なGPUを手掛けるNVIDIAがこれに応えるために開発した、行列積和アクセラレータがTensorコアである[1][2]。
Tensorコアは行列の混合精度融合積和演算(FMA)に特化した機能を有する。すなわち1命令で低精度行列積 + 高精度アキュムレータ加算を実行する。例えばFP32の行列
- Tensorコアのページへのリンク