NVIDIA CUDA Compiler
(Nvcc から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/06/09 12:21 UTC 版)
ナビゲーションに移動 検索に移動作者 | NVIDIA |
---|---|
種別 | コンパイラ |
ライセンス | プロプライエタリ・ソフトウェア |
公式サイト |
docs |
Nvidia CUDA コンパイラ (NVCC)は、CUDAとの使用を目指したNVIDIAによるプロプライエタリコンパイラである。CUDAコードは、CPUとGPUの両方で動作する。NVCCはCPUとGPUを分離し、ホストコード(CPU上で実行される部分のコード)をGCC、Intel C++ Compiler、あるいはMicrosoft Visual CのようなC言語コンパイラへ転送する。そして、デバイスコード(GPU上で実行する部分)をGPUへ転送する。デバイスコード(PTX)は、さらにGPU固有のバイナリコードへコンパイルされる。NVCCはLLVMに基づいている[1]。NVIDIAが提供した資料に従うと、nvccはバージョン7.0でC++11標準と少数のC99の機能によって定義される多くの言語構造をサポートしている。バージョン9.0においてC++14標準由来のより多くの言語構造がサポートされている[2]。
CUDAの言語拡張(.cu)を含んでいるあらゆるソースファイルは、nvccでコンパイルされる。NVCCは、コンパイラドライバであり、全ての必要なツールとcudacc、g++、clなどのようなコンパイラによって動作する。NVCCは、C code(CPUコード)、PTX(GPU擬似アセンブラ)、あるいはオブジェクトコード(GPUで直接実行可能)のいずれも出力できる。C codeは、CPU用のコードなので、他のツールを使ってアプリケーション(CPU用コードで書かれている)の他の部分と一緒にコンパイル・リンクされなければならない。CUDAコードを含んだ実行ファイルは、CUDAコアライブラリ(cuda)とCUDAランタイムライブラリ(cudart)を必要とする。
他の広く使われているライブラリは以下のものがある。
- CUBLAS: BLAS の実装
- CUFFT: FFT の実装
- CUDPP (Data Parallel Primitives): 並列プログラミングで使用する Reduction, Scan, Sort
- Thrust: 並列プログラミングで使用する Reduction, Scan, Sort
関連項目
- OpenCL
- Heterogeneous System Architecture
出典
- ^ “CUDA LLVM Compiler”. NVIDIA Corporation. 2016年4月6日閲覧。
- ^ https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#c-cplusplus-language-support
- David B. Kirk, and Wen-mei W. Hwu. Programming massively parallel processors: a hands-on approach. Morgan Kaufmann, 2010.
- Nvidia Documentation on nvcc. http://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/
- CUDPP. http://gpgpu.org/developer/cudpp
- NVIDIA CUDA Compilerのページへのリンク