レイトレーシングに最適化した次世代GPU「Turing」登場|MacFan

アラカルト 今あるテクノロジー

レイトレーシングに最適化した次世代GPU「Turing」登場

文●今井 隆

アップルデバイスに搭載される、さまざまなテクノロジーを超ディープに解説!

読む前に覚えておきたい用語

レイトレーシング(Ray Tracing)

レイトレーシングは光線追跡法とも呼ばれ、ある点における明るさや色合いなどの情報を、そこに届くまでの光を追跡することで求めるシミュレーション手法。光の反射や屈折などを正確に計算することでリアリティの高いCGが得られる反面、計算には高い演算能力を必要とする。

リアルタイムレイトレーシングAPI

CPUやGPUの性能向上により、計算に膨大な時間がかかっていたレイトレーシングを短時間で処理できるようになったことから、Imagination TechnologiesのOpenRL、NVIDIAのRTX、Micro softのDXRなどのリアルタイムレイトレーシングAPIがこの数年で登場してきた。

GPUのターニングポイント

1つ目は1999年にリリースされたGeForce 256で、パソコン向けグラフィックスチップでは初めてジオメトリエンジンを搭載しGPUという名前が与えられた。2つ目は2006年にリリースされたGeForce 8800 GTXで、初めて統合型シェーダ(CUDAコア)を採用しGPGPUへの道を開いた。

 

 

 

チューリングが開く新しいGPUの世界

エヌビディア(NVIDIA)は今年8月、新たなチューリング(Turing)アーキテクチャを採用する次世代GPU「クアドロRTX(Quadro RTX)」シリーズ、および「ジーフォースRTX 20(GeForce RTX20)」シリーズを相次いで発表した。このチューリングアーキテクチャGPUの最大の特徴は、パソコン向けのGPUとしては初めてリアルタイム・レイトレーシングに最適化したアーキテクチャを採用している点にある。

レイトレーシングは、映画などのCGシーンや工業製品や建築などのデザイン現場でのシミュレーションに使用されているレンダリング手法で、光が光源から目に届くまでの過程(レイ=光線)を目から光源に向かって逆追跡し、物質との交点での屈折や反射を計算することで各ピクセルの色を決定する。これによって、たとえば水面に映り込んだ風景や水中で屈折して見える物体の描写、人物などの瞳に映り込む風景の描写などが正確になり、非常にリアルなCG表現が実現できるのがレイトレーシングの大きな特徴だ。

その一方で、ピクセル単位でのレイの追跡演算が必要になるため膨大な演算量となり、従来のソフトウェア処理では計算時間がかかりすぎる問題があった。映画にCGが導入された当初は、ワンシーンのCGをレイトレーシングで演算するためにスーパーコンピュータを複数使って数カ月間並列処理させる必要があったが、近年ではCPUの命令拡張や性能向上によってパソコンでも同様の演算が可能なレベルになってきた。

さらに、最近ではGPUの汎用演算機能(GPGPU)を用いてレイの追跡演算を行うことで、限られた条件の範囲内ではレイトレーシングの実時間処理、すなわち「リアルタイム・レイトレーシング」が実用化されつつある。これに合わせて各社でリアルタイム・レイトレーシングAPIの開発が進められ、イマジネーションテクノロジーズのPowerVR OpenRL、エヌビディアのOptiX(OptiX Application Acceleration Engine)およびRTX、マイクロソフトのDXR(DirectX Raytracing)、アップルのメタル2(Metal 2)で追加された「Metal for Ray Tracing Acceleration」などがリアルタイム・レイトレーシングに対応したAPIとしてリリースされている。

 

真のリアルタイム レイトレーシング

このリアルタイム・レイトレーシングを実用的なものとするために、チューリングではレイの追跡演算、およびオブジェクト(物体)との交差判定「インターセクション」を専用に処理する「RTコア」を搭載しているのが大きな特徴だ。RTコアの演算能力は毎秒最大10ギガレイと発表されており、単純に計算するとフルHD(1920x1080ピクセル)、60fpsの描画において、ピクセルあたり約80本のレイ(光線)をリアルタイム演算できることになる。

この演算性能は従来のパスカル(Pascal)世代のジーフォースGPUのCUDA演算、すなわちGPUでソフトウェア処理した場合の毎秒約100メガレイ(フルHDの1ピクセルあたりレイ約1本)と比べておよそ100倍近いレイ演算性能になる。もう1つチューリングに追加された機能が「Tensorコア」と呼ばれるディープラーニングの推論エンジンで、FP16演算時の性能は110テラフロップス(TFLOPS)に達し、AIによるノイズ削減処理「DLSS(Deep Learning Super-Sampling)」を従来のCUDAコア演算に比べて2倍以上の速度で処理するとされている。これによって3Dレンダリングで欠かせないアンチエイリアス処理を高速化できる。

さらに重要なことは、このRTコアやTensorコアはCUDAコアとは独立かつ並列に動作するという点で、従来CUDAコアで行っていたレイの追跡演算をRTコアに、アンチエイリアス処理をTensorコアにそれぞれオフロードすることで、解放された多数のCUDAコアを別の処理、たとえばライティング演算や陰影処理演算などのレンダリング処理に振り向けることができ、トータルでのグラフィックスパフォーマンスの大幅な向上に期待することができる。




続きを読むためにはログインが必要です。
月額720円ですべてのコンテンツの閲覧が可能になります。
下のボタンより、お申込手続きを行ってください。

  • ログイン
  • 会員登録

同カテゴリ記事一覧