NVIDIAのテクニカルマーケティング担当副社長トニー・タマシ氏によれば、GeForce GTX 200シリーズは、こうしたCUDAを利用して作成されたアプリケーションを利用するプラットフォームとしても意識した設計になっているという。「GeForce GTX 200シリーズはゲーム用途の利用だけを意識した従来のGPUとは異なる設計思想を持っている。具体的にはコンピューティングプラットフォームとしての側面を意識した設計になっている」とタマシ氏は述べ、それを実現するためにGeForce GTX 200シリーズのマイクロアーキテクチャの設計は行われていると説明した。

　GeForce GTX 200は「Thread Processor」と呼ばれるプロセッサコアを240個内蔵する。それぞれのThread Processorは整数演算器と倍精度（64ビット）の浮動小数点演算器を備え、8個のThread Processorで「Thread Processor Array」という単位を構成する。それぞれのThread Processor Arrayは16Kバイトのローカルメモリを備えている。さらに、3つのThread Processor Array（＝24個のThread Procesor）で「Thread Processing Cluster」という単位が構成され、それぞれが1次キャッシュメモリを備えている。

　こうした構造をとることで、GeForce GTX 200シリーズでは3万を超えるスレッドをGPU全体で処理できるようになっている（前世代のGeForce 8／GeForce 9シリーズでは1万前後）。こうした演算器の増加や効率の向上などにより、GeForce 8800 GTXが533G FLOPS（FLOPSとは1秒間に実行できる浮動小数点演算の数）だったのに対して、GeForce GTX 200シリーズの上位モデルとなるGeForce GTX 280では933G FLOPSと倍近い性能を実現している。

　もちろん、GeForce GTX 200シリーズではグラフィックス処理における性能向上も図られている。NVIDIAによると、倍精度の浮動小数点演算をサポートしたため、テクスチャ処理の性能が向上しているほか、ジオメトリシェーダの処理能力が向上しているという。このほかにもレジスタファイルが倍になり、シェーダプログラムを実行する効率が向上するなどの特徴を備えている。

NVIDIA テクニカルマーケティング担当副社長トニー・タマシ氏

GeForce GTX 200シリーズのダイ写真

GeForce GTX 200シリーズの内部構成。それぞれ整数演算器と浮動小数点演算器を持つ240個のプロセッサコア（Thread Processor）を備えている

Thread Processor Arrayの構造。8個のThread Processorから構成され、16Kバイトのローカルメモリを備えている

3つのThread Processor ArrayはThread Processing Clusterを構成し、10個のThread Processoing Clusterで1つのダイを構成している

GeForce GTX 280とGeForce 8800 GTXの比較

エンコードをGPUに任せて全体の性能をアップする

　NVIDIAは、GeForce GTX 200シリーズの発表にあわせてCUDA対応アプリケーションをいくつか紹介している。1つはAdobeのPhotoshop CS3を利用したデモで、デジタルカメラで撮影したRAW画像を展開してそれを加工する処理をGPUで行っている。通常、RAW画像を読みこんで加工する場合、CPUを利用して演算を行うとそれなりに時間がかかり、加工後の状況をライブビューで確認するのも難しい。しかし、GPUを利用して描画と加工を行うことで瞬時に読み込みを完了させ、ズームなどの加工作業を軽々と行うことができるようになる。

　さらに、米国のElemental Technologiesが作成した、GPUを利用したエンコードソフトウェアのデモも紹介された。「BadaBOOM Media Converter」と呼ばれるそのソフトウェアは、CUDAの導入によって利用可能となったGPUを利用してメディアファイルのトランスコードやエンコードを行う。NVIDIAが行ったベンチマークテストによれば、動作クロック1.8GHzのデュアルコアCPUに比べて、MPEG-2からMPEG-4 AVCへのトランスコードを18倍も高速に行うことができたという。

GPUを利用してPhotoshop CS3でRAWの写真を処理しているところ、非常に高速な処理ができていた

GPUを利用してエンコードを行っている。バックグランドではiTunesがCPUを利用してMPEG-4 AVCへのトランスコードを行っている

CPUに比べて18倍も高速に処理が可能であるとNVIDIAは説明している

アクセストップ10

2024年04月27日更新

8K／30fpsで撮影できる「Insta360 X4」は想像以上のデキ　気になる発熱と録画可能時間を検証してみたら（2024年04月26日）
AI PC時代の製品選び　展示会「第33回 Japan IT Week 春」で目にしたもの　AI活用やDX化を推進したい企業は要注目！（2024年04月25日）
Microsoftが「MS-DOS 4.0」をオープンソース化　IBMの協力で（2024年04月26日）
Micronが232層QLC NAND採用の「Micron 2500 SSD」のサンプル出荷を開始　コスパと性能の両立を重視（2024年04月26日）
ワコムが有機ELペンタブレットをついに投入！　「Wacom Movink 13」は約420gの軽量モデルだ（2024年04月24日）
わずか237gとスマホ並みに軽いモバイルディスプレイ！　ユニークの10.5型「UQ-PM10FHDNT-GL」を試す（2024年04月25日）
エレコム、10GbEポートを備えたWi-Fi 7対応無線LANルーター（2024年04月25日）
プロセスノードに加えて新技術も売り込む！　Intelが半導体の「受託生産」で使う“武器”【後編】（2024年04月26日）
あなたのPCのWindows 10／11の「ライセンス」はどうなっている？　調べる方法をチェック！（2023年10月20日）
QualcommがPC向けSoC「Snapdragon X Plus」を発表　CPUコアを削減しつつも圧倒的なAI処理性能は維持　搭載PCは2024年中盤に登場予定（2024年04月25日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

ゲームを超えるミッションとは──NVIDIAが「GT200」にこめたGPUの可能性（2/3 ページ）

GeForce 8800 GTXの倍近い演算性能を実現するGeForce GTX 280