NVIDIA CUDA Compilerとは？わかりやすく解説

NVIDIA CUDA Compiler
作者	NVIDIA
種別	コンパイラ
ライセンス	プロプライエタリ・ソフトウェア
公式サイト	docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/#introduction
	テンプレートを表示

Nvidia CUDA コンパイラ (NVCC)は、CUDAとの使用を目指したNVIDIAによるプロプライエタリコンパイラである。CUDAコードは、CPUとGPUの両方で動作する。NVCCはCPUとGPUを分離し、ホストコード（CPU上で実行される部分のコード）をGCC、Intel C++ Compiler、あるいはMicrosoft Visual C（英語版）のようなC言語コンパイラへ転送する。そして、デバイスコード（GPU上で実行する部分）をGPUへ転送する。デバイスコード(PTX)は、さらにGPU固有のバイナリコードへコンパイルされる。NVCCはLLVMに基づいている^[1]。NVIDIAが提供した資料に従うと、nvccはバージョン7.0でC++11標準と少数のC99の機能によって定義される多くの言語構造をサポートしている。バージョン9.0においてC++14標準由来のより多くの言語構造がサポートされている^[2]。

CUDAの言語拡張(.cu)を含んでいるあらゆるソースファイルは、nvccでコンパイルされる。NVCCは、コンパイラドライバであり、全ての必要なツールとcudacc、g++、clなどのようなコンパイラによって動作する。NVCCは、C code(CPUコード)、PTX(GPU擬似アセンブラ)、あるいはオブジェクトコード(GPUで直接実行可能)のいずれも出力できる。C codeは、CPU用のコードなので、他のツールを使ってアプリケーション(CPU用コードで書かれている)の他の部分と一緒にコンパイル・リンクされなければならない。CUDAコードを含んだ実行ファイルは、CUDAコアライブラリ(cuda)とCUDAランタイムライブラリ(cudart)を必要とする。

他の広く使われているライブラリは以下のものがある。

CUBLAS: BLAS の実装
CUFFT: FFT の実装
CUDPP (Data Parallel Primitives): 並列プログラミングで使用する Reduction, Scan, Sort
Thrust: 並列プログラミングで使用する Reduction, Scan, Sort

出典

^ “CUDA LLVM Compiler”. NVIDIA Corporation. 2016年4月6日閲覧。
^ https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#c-cplusplus-language-support

David B. Kirk, and Wen-mei W. Hwu. Programming massively parallel processors: a hands-on approach. Morgan Kaufmann, 2010.
Nvidia Documentation on nvcc. http://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/
CUDPP. http://gpgpu.org/developer/cudpp