Parallel Thread Execution
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/06/12 16:13 UTC 版)
Parallel Thread Execution (PTX あるいは NVPTX[1]) は、NVIDIAのCUDAプログラミング環境で使用されるGPU用の疑似アセンブリ言語である。nvccコンパイラは、C言語/C++の独自拡張であるCUDA C/C++で書かれたコードのうち、GPU上で実行されるデバイスコードをPTXに翻訳する。そしてグラフィックスドライバは、PTXをGPUのプロセッシングコア上で実行されるバイナリコードに翻訳するコンパイラを搭載している。中間表現であるPTXを利用することで、演算能力や機能 (compute capability: CC) および設計思想の異なるハードウェア上で共通して動作するCUDAプログラムを記述したり[2]、ドライバが生成するバイナリコードを実行環境に応じて最適化したりすることが容易になる。
- ^ "User Guide for NVPTX Back-end — LLVM 7 documentation". llvm.org.
- ^ コンピュータアーキテクチャの話(350) NVIDIAの世代別GPUに見るハードウェアの違い | マイナビニュース
- ^ a b "PTX ISA Version 2.3" (PDF).
- ^ GPU内に存在する複数のCUDAコア上で並列実行される処理を記述した関数をカーネル (kernel) と呼ぶ。ストリーム・プロセッシングで用いられる用語であり、OpenCLなどでも使われている。
- ^ "Google Code Archive - Long-term storage for Google Code Project Hosting". code.google.com.
- 1 Parallel Thread Executionとは
- 2 Parallel Thread Executionの概要
- 3 外部リンク
- Parallel Thread Executionのページへのリンク