定数バッファ
前のパートではシェーダを使った画面クリアを行いました。 が、あのままだとクリアする色を変えたくなったとき、その色に合わせて同じようなシェーダを作る必要が出てきます。
誰の目が見ても上のやり方は非効率的でしょう。 C++の関数の引数のようにシェーダのエントリポイントに任意の値を渡すようにしたいですが、シェーダではできません。
ですが、代わりとなる方法がシェーダでは用意されています。 このパートではそれについて説明していきます。
概要
DX11ではシェーダ実行時に自由に使うことができる値として、定数バッファ(英訳:ConstantBuffer)というものが用意されています。 今パートに対応しているサンプルプロジェクトはPart02_ConstantBufferになります。
-
シェーダ内での使い方
- cbufferキーワード
-
ID3D11Buffer
-
設定と作成
ID3D11DeviceContext::CSSetConstantBuffers関数
ID3D11Device::CreateBuffer関数 -
更新処理
ID3D11DeviceContext::UpdateSubresource関数
ID3D11DeviceContext::Map関数
-
設定と作成
- まとめ
- 補足
- 定数バッファのパッキング
- GPUメモリのコピー
1.シェーダ内での使い方
定数バッファを使うときはcbufferキーワード使い、構造体のように宣言します。 あと、アンオーダードアクセスビュー(以下、UAV)と同じでスロット番号も指定可能です。 定数バッファの場合は”b0”のように接頭語にbをつけて指定してください。 詳細は参考サイトのMSDNをご覧ください
ドキュメント: シェーダー定数(DirectX HLSL)(日本語) Shader Constants(英語)
上のコードでは”Param”と名付けた定数バッファを宣言し、クリアしたい色(clearColor)と画面サイズ(screenSize)の2つの変数を中で宣言しています。
定数バッファとして宣言された変数はシェーダ内のどこからでも使うことが出来ます。 いわば、c++のグローバル変数のようなものです。 グローバル変数との違いは代入ができないというだけなので、const宣言されたグローバル変数だという認識でいいでしょう。
使い方は以上です。 次はCPU側の説明になります。
2.ID3D11Buffer
設定
まず、定数バッファをGPUへ設定する方法について見ていきます。
CPU側での定数バッファはID3D11Bufferとして扱います。 ID3D11BufferとはGPUのメモリを表すものになります。 GPU上のメモリにアクセスするにはこれかまたはテクスチャ(英訳:Texture)を介して行います。
ID3D11DeviceContext::CSSetConstantBuffers関数で定数バッファの設定を行っています。 引数の数が異なるだけで、各引数は前パートで使ったID3D11DeviceContext::CSSetUnorderedAccessViews関数と同じ意味合いになります。
設定した後は、前パートと同じくID3D11DeviceContext::Dispatch関数でシェーダを実行すれば、シェーダ内で定数バッファが使われます。
作成
それでは次に、ID3D11Bufferの作成について見ていきましょう。 ID3D11Bufferを作成することはGPUメモリを確保することであり、C++でいうnew演算子と同じ意味合いになります。
上のコードのthis->mpDevice->CreateBufferで定数バッファを作成しています。
ID3D11Device::CreateBuffer関数の引数は次のものになります。
ドキュメント: ID3D11Device::CreateBuffer(日本語) ID3D11Device::CreateBuffer(英語)
ID3D11Device::CreateBuffer
- 第1引数:D3D11_BUFFER_DESC
作成するID3D11Bufferの情報を表すD3D11_BUFFER_DESCを渡します。 メンバ変数の数が多いですが、定数バッファを作成する上で必要となるものは上のコードで使っているものです。
ドキュメント: D3D11_BUFFER_DESC(日本語) D3D11_BUFFER_DESC(英語)重要となるD3D11_BUFFER_DESCのメンバ
- ByteWidth
ByteWidthはID3D11Bufferが確保するGPU上のメモリサイズになります。 単位はbyteになり、定数バッファとして扱う場合は必ず、値を16の倍数でなければなりません。 16の倍数でない場合は作成に失敗しますので注意してください。
- BindFlag
BindFlagはGPU上でどういった用途でID3D11Bufferを使うか指定するものです。 ID3D11Bufferは定数バッファ以外の目的でも使いますが、それについてはその都度説明していきます。 今回は定数バッファとして使うので、D3D11_BIND_CONSTANT_BUFFERを指定しています。
ドキュメント: D3D11_BIND_FLAG(日本語) D3D11_BIND_FLAG(英語) - Usage
Usageはどのようにメモリの読み書きを行うかを指定します。 今回は定数バッファはGPU上でしか読み書きしないので、D3D11_USAGE_DEFAULTを指定しています。 メモリ読み書きの種類は以下のリンクを参照してください
ドキュメント: D3D11_USAGE(日本語) D3D11_USAGE(英語) - CPUAccessFlags
CPUAccessFlagsはCPUからアクセスするときどのようなアクセスを行うかを指定します。 Usageに設定したものによって使えるフラグが変わりますので注意してください。
ドキュメント: D3D11_CPU_ACCESS_FLAG(日本語) D3D11_CPU_ACCESS_FLAG(英語)
- ByteWidth
- 第2引数:D3D11_SUBRESOURCE_DATA
D3D11_SUBRESOURCE_DATAは初期データを表します。 使い方はコードを見てもらえれば十分でしょう。 初期データとして渡すCPU上のデータのアドレスとそのデータ長を設定するだけです。 この構造体はテクスチャの作成時にも使用します。 また後述するID3D11DeviceContext::Map関数でもこれと似た内容のD3D11_MAPPED_SUBRESOURCEを使います。
ドキュメント: D3D11_SUBRESOURCE_DATA(日本語) D3D11_SUBRESOURCE_DATA(英語) - 第3引数:ID3D11Buffer**
作成したID3D11Bufferを受け取る変数を渡します。
作成については以上です。 これで自由な値をシェーダ側で使えるようになりました。 が、このままでは作成時に設定した値しか使えません。 DX11ではID3D11Bufferの値を更新する方法をもちろん提供していますので、次はそれについて見ていきます。
更新処理
ID3D11Bufferの値を更新する方法は2通りあります。
ID3D11DeviceContext::UpdateSubresource関数
ドキュメント: ID3D11DeviceContext::UpdateSubresource (日本語) (英語)
※ID3D11DeviceContext::UpdateSubresourceの日本語訳の内容は翻訳ミスにより一部誤ったものになっていますので注意してください
参考サイト
ID3D11DeviceContext::UpdateSubresource関数はD3D11_BUFFER_DESC::UsageにD3D11_USAGE_DEFAULTかD3D11_USAGE_STAGINGを指定したID3D11Bufferの内容を変更することができます。 引数がいくつかありますが、定数バッファの内容を更新したいときは第1引数に変更したい定数バッファと第4引数に変更内容だけを指定してください。
データが更新されるタイミング
細かな話になりますが、ID3D11DeviceContext::UpdateSubresource関数を使った場合、データが更新されるタイミングは決まっていません。 DX11ではシェーダの設定やDispatch関数などの実行命令、ID3D11DeviceContext::UpdateSubresource関数などID3D11DeviceContextの関数を使うと全て コマンドバッファと呼ばれる一時的なストレージ空間へ一度格納され、 コマンドバッファに積まれた内容は積まれた順にGPUの都合がいいときに実行されます。 言い換えると、関数を呼び出したからと言って直ちにGPU上で命令が処理されるわけではありません。 DX11を使うことはCPUとGPU間でのマルチスレッドプログラミングを暗黙の上で行っていることになります。 なので、ID3D11DeviceContext::UpdateSubresource関数を呼び出したら、 直ちにID3D11Bufferの内容(GPU上のメモリ)が変更されているとは考えない方がいいでしょう。
また非同期的にデータの更新を行っているため、ID3D11DeviceContext::UpdateSubresource関数に渡したソースデータは一度、 コマンドバッファへコピーされます。 ID3D11DeviceContext::UpdateSubresource関数はコピーが2回起きる重たい処理となりますので、パフォーマンスが必要な場合は注意してください。
ID3D11DeviceContext::Map関数
ID3D11DeviceContext::Map関数はD3D11_BUFFER_DESC::Usageに D3D11_USAGE_DYNAMICを、D3D11_BUFFER_DESC::CPUAccessFlagsに D3D11_CPU_ACCESS_WRITEを指定したID3D11Bufferの内容を変更することができます。 データの読み書きはD3D11_MAPPED_SUBRESOURCEを介して行います。 Map関数を使った後は、必ずID3D11DeviceContext::Unmap関数を呼び出してください。 これはGPUで使用中の定数バッファを内容を書き換えてしまうことを防ぐために必要になります。
ドキュメント: ID3D11DeviceContext::Map (日本語) (英語)
ID3D11DeviceContext::Map
- 第1引数:マップするID3D11Buffer
- 第2引数:サブリソースのインデックス
定数バッファの場合は必ず0を指定してください。
- 第3引数:行うマップの種類
定数バッファの場合はD3D11_MAP_WRITE_DISCARDを指定する必要があります。 D3D11_MAP_WRITE_DISCARDはマップ対象の以前の内容を無効にしてデータを書き込むことを表していますので、 定数バッファのすべての内容を設定する必要があります。
- 第4引数:GPUで使用中だった場合のCPU側の対応
第1引数に渡したリソースがGPUで使用中だった場合のCPU側の対応を指定します。 D3D11_MAP_FLAG_DO_NOT_WAITを渡すと使用中だった場合は戻り値にDXGI_ERROR_WAS_STILL_DRAWINGを返すようになります。 このフラグは第3引数にMAP_READかMAP_WRITE、MAP_READ_WRITEを指定したときにしか使うことが出来ません。
- 第5引数:D3D11_MAPPED_SUBRESOURCE
マップに成功した場合、渡したD3D11_MAPPED_SUBRESOURCEにマップしたデータの先頭ポインタとデータの長さ等の情報が入ります。
ドキュメント:D3D11_MAPPED_SUBRESOURCE (日本語) (英語)
まとめ
この記事ではシェーダから自由に使うことが出来る定数バッファについて見ていきました。 読み込みしかできませんが、これで汎用的なシェーダを作成することが出来ます。
ID3D11Bufferに関しては定数バッファ以外の目的でも使います。 DX11ではGPUメモリをID3D11Bufferと次のパートで説明するテクスチャを使って表現しています。 この2つは共通している部分が多く、今回見た更新処理はテクスチャでも同じく使うことが出来ます。
また、更新処理はCPUとGPUで異なるメモリを使っていることから、メモリ転送によるボトルネックが起きやすい処理になっています。 パフォーマンスの観点から見ればGPUとCPUでメモリを共有している特殊な環境でない限り、必要最低限しかCPU/GPU間のメモリのやり取りが起きないようする必要がありますので注意してください。
補足
定数バッファのパッキング
シェーダ内で定数バッファを宣言するとき、変数の並びによってサイズが変わったりします。定数バッファではアライメントが16byte単位になっており、上のParam1のv1のように float2の後にfloat4 v2;と宣言すると(sizeof(float2)+sizeof(float4))=24byteとなり、v2が16byteの境界をまたいでしまいます。 この場合はv2は自動的に先頭アドレスが16byteの倍数になるよう配置され、v1の後ろにできる8byteは未使用領域となります。 これはC++での構造体などで起きることと同じことです。
Param2のようにv2やv4の後ろにfloat2やfloat等16byteの境界をまたがないように宣言すれば 未使用領域がない効率的なメモリ配置にすることができます。
以上から定数バッファを宣言するときはParam2のように変数の並びに注意する必要がありますが、 パッキング指定をすることでParam1の並びでもParam2と同じメモリ配置にすることが出来ます。 なお、パッキング指定した場合はすべての変数にパッキングを設定しなければいけません。
アライメントについてはこちらを参考にしてください。GPUメモリのコピー
ID3D11DeviceContextにはGPU内でのメモリコピーを行うための関数が用意されています。
ドキュメント
ID3D11DeviceContext::CopyResource関数
日本語
英語
ID3D11DeviceContext::CopySubresourceRegion関数
日本語
英語
サンプルではScene::onRender関数の最後でシェーダの実行結果をバックバッファへコピーするために使用しています。 バックバッファについては別パートで説明しますが、DX11での最終出力先みたいなものでバックバッファの内容が画面に表示されます。
<前 | トップ | 次> |