geforc_rtx_30_logo

49: Socket774 (スップ Sdff-3sjn) 2020/09/03(木) 19:22:36.99 ID:dfF0sPBcd
NVIDIAがコミュニティの質問に答える
RedditでのQ&Aセッションでは、NVIDIAの社員が、サブレディットコミュニティからの最も気になる質問のいくつかに答えています

geforce-rtx-3090-product-gallery-full-screen-3840-2

今回のAmpere RTXシリーズの発表では、あまり詳細な情報が出てこなかったのは周知の事実だ。実際には、技術発表、製品デザイン、価格設定などに限定されていた。

より多くの詳細は、後にNVIDIAやGeForceのWebサイトのブログ記事や公式仕様書の中で提供された。

Q&Aセッションでは、NVIDIAのコミュニティマネージャーから直接回答がありましたが、今週予定されているプレスブリーフィングと、最初のAmpereカードが正式に発売された後(9月17日)には、もっと多くのことが分かるようになると期待しています。

・HDMI 2.1のスペック
GhostMotley - Ampereはフル48Gbpsの帯域幅でHDMI 2.1をサポートしていますか?

Qi Lin] はい。NVIDIA Ampere Architectureは、4つのレーンすべてで12Gbs/レーンという最高のHDMI 2.1リンクレートをサポートし、さらにDSC(Display Stream Compression)をサポートしているので、HDRで8K、60Hzまでの電力を供給することができます。

・アンペアのためのSSDの要件
Pengwin17523 - RTX I/Oのために特定のSSDの速度要件はありますか?

Tony Tamasi] RTX IOのためのSSDの速度要件はありませんが、明らかに、最新世代のGen4 NVMe SSDのようなより速いSSDの方が、より良い結果、つまりより速いロード時間、そしてゲームがより多くのデータをダイナミックに世界にストリーミングする能力を生み出すでしょう。いくつかのゲームは、将来的にSSDのパフォーマンスのための最小要件を持つかもしれませんが、それはゲーム開発者によって決定されます。RTX IOは、I/Oに必要なCPU負荷を減らし、GPUベースの解凍を可能にすることで、どれだけ速くてもSSDのパフォーマンスを加速させ、ゲーム資産を圧縮形式で保存することを可能にし、CPUコアの数十個分の負荷をその作業から解放する。圧縮率は通常2:1なので、SSDの読み込み性能を2倍に増幅することができます。

・RTX IO
SBMS-A-Man108 - RTX IOはSSDのスペースをVRAMとして使用できますか?それとも私は完全に誤解しているのでしょうか?

Tony Tamasi] RTX IOは、従来の方法よりもはるかに高速でSSDからデータを読み出すことを可能にし、データをGPUによって圧縮された形式で保存して読み出すことを可能にし、GPUで解凍して使用することを可能にします。これにより、SSDがフレームバッファメモリを置き換えることはできませんが、SSDからのデータが、CPUのオーバーヘッドをはるかに少なくして、GPUとGPUメモリをはるかに高速に取得することができます。

Aztec47 - Pytorchのような機械学習ライブラリにRTX IOが来るのを見ることができますか?これはリアルタイムアプリケーションのパフォーマンスを向上させるのに役立つでしょう。

Tony Tamasi] NVIDIAは、約1年前にNVIDIA GPU DirectStorageで、さまざまなデータ分析プラットフォーム向けの高速I/Oソリューションを提供しました。これは、特にAIやHPCタイプのアプリケーションやワークロードのために、GPUとストレージ間の高速I/Oを提供します。詳細については、https://developer.nvidia.com/blog/gpudirect-storage/ をご覧ください。

Qrios1ty - RTX I/O機能に興奮していますが、どのように正確に動作するのか部分的に理解していません。

Tony Tamasi] RTX IOとDirectStorageは、アプリケーションが新しいAPIを組み込むことで、これらの機能をサポートする必要があります。Microsoftは来年、ゲーム開発者向けにDirectStorage for Windowsの開発者プレビューを目標にしており、NVIDIA RTXゲーマーは、RTX IOで強化されたゲームが利用できるようになり次第、その恩恵を受けることができるようになるだろう。

(続きはこちら)
30シリーズの詳細


52: Socket774 (スップ Sdff-3sjn) 2020/09/03(木) 19:24:06.90 ID:dfF0sPBcd
Founders Edition RTX 3090は、Titan RTXとFounders Edition RTX 2080 Superよりも静かです。特定のパートナーのデザインに対してはテストしていませんが、聞いたことに感銘を受けると思います…むしろ、聞こえません。:-)


65: Socket774 (ワッチョイ 471d-Jh+E) 2020/09/03(木) 19:28:52.74 ID:TWQjMuVO0
>>52
こういうの出る度FE欲しくなるわ

81: Socket774 (ワッチョイ 27dc-XrX+) 2020/09/03(木) 19:31:53.14 ID:VAWbKXYp0
今回のFEはオリファンより特殊構造だし

218: Socket774 (ワッチョイ 676d-wVaW) 2020/09/03(木) 20:54:00.81 ID:OXgIKKUl0
RTX IOにはSSDの必要速度要件はないのか
先日のビデオからはpcie4のGEN4 NVMe以降のみと思われたがpcie3でもいけるんか?下手すりゃSATAでもいけたりしてw
5~6秒くらいは全然待てるので(手を休めたり腰を伸ばしたりするし)そこまで速くなくてもいいわ。だがMSはもっと早くAPI作れ

230: Socket774 (ワッチョイ 679e-wMNz) 2020/09/03(木) 20:59:07.33 ID:7qI1fhAq0
>>218
DirectStorageがNVMeとの組み合わせって言ってるので使うならNVMe SSDなんでしょ。
https://devblogs.microsoft.com/directx/directstorage-is-coming-to-pc/

233: Socket774 (ワッチョイ c7b1-kGl3) 2020/09/03(木) 21:01:08.31 ID:a8eu2Fvy0
>>230
そう。やっとNVMeに意味が生まれるかもしれない。
といっても現時点でメインメモリを通してテクスチャ転送することがそんなに大きなネックになってないから、大して意味ない可能性が高いんだけど。

234: Socket774 (ワッチョイ 5f73-bPxX) 2020/09/03(木) 21:02:00.63 ID:hqqT8TqA0
>>218
NVMeの機能を使うらしい
Gen4からその機能が付いているのかが気になったけど、それはGen3でも遅いだけっぽい(?)

301: Socket774 (ワッチョイ 676d-wVaW) 2020/09/03(木) 21:31:29.79 ID:OXgIKKUl0
>>230
>>234
ありがとう。該当部分?をDEEPLさんに訳してもらった

NVMeデバイスは、非常に高帯域幅のSSDベースのデバイスであるだけでなく、NVMeキューと呼ばれるハードウェアデータアクセスパイプを持っており、特にゲームのワークロードに適しています。ドライブからデータを取得するために、OSはドライブにリクエストを送信し、データはこれらのキューを介してアプリに配信されます。NVMe デバイスは複数のキューを持つことができ、各キューは一度に多くのリクエストを含むことができます。これは、現代のゲームワークロードの並列性とバッチ処理の性質に完璧にマッチしています。DirectStorageプログラミングモデルは、基本的に開発者が高度に最適化されたハードウェアを直接制御できるようにします。

さらに、既存のストレージAPIは、アプリケーションがIOリクエストを行ってからストレージデバイスがリクエストを満たすまでの間に多くの「余分なステップ」が発生し、結果的に不必要なリクエストのオーバーヘッドが発生します。(中略)NVMeドライブと適切に構成されたゲーミングマシンでは、DirectStorageはこれらの余分なステップが必要ないことを前もって検出し、必要なチェック/操作をすべてスキップすることができるので、すべてのIOリクエストをより安く満たすことができます。

これらの理由から、NVMeはDirectStorageと高性能な次世代ゲーミングIOに最適なストレージ技術です。

少なくともまともに機能させるにはNVMeが必要っぽいね。M.2 SSD買うときNVMeにしておいて良かったかも(まぁGEN3で遅めのだけど…)

112: Socket774 (ワッチョイ 2773-9akW) 2020/09/03(木) 19:41:12.72 ID:TCPvEOO70
Ampere 30シリーズSMの主な設計目標の1つは、FP32演算のスループットをTuring SMの2倍にすることでした。
この目標を達成するために、Ampere SMにはFP32とINT32演算のための新しいデータパス設計が含まれています。
各パーティションの1つのデータパスは、1クロックあたり16個のFP32演算を実行できる16個のFP32 CUDAコアで構成されています。
もう1つのデータパスは、16個のFP32 CUDAコアと16個のINT32コアの両方で構成されています。
この新しいデザインの結果、各Ampere SMパーティションは、1クロックあたり32個のFP32演算、または16個のFP32と16個のINT32演算のいずれかを実行することができます。
4つのSMパーティションを合わせても、1クロックあたり128個のFP32演算を実行することができ、
これはTuring SMの2倍のFP32レート、または1クロックあたり64個のFP32と64個のINT32演算を実行することができます。

FP32の処理速度が2倍になることで、多くの一般的なグラフィックスや計算操作、アルゴリズムのパフォーマンスが向上します。
最近のシェーダのワークロードは通常、FFMA、浮動小数点加算(FADD)、浮動小数点乗算(FMUL)などのFP32演算命令と、
アドレス指定やデータ取得のための整数加算、浮動小数点比較、処理結果のmin/maxなどのより単純な命令を組み合わせたものが混在しています。
性能向上は、命令の組み合わせによって、シェーダとアプリケーションのレベルで異なります。
レイトレーシングのデノイジングシェーダは、FP32のスループットを2倍にすることで大きな利益を得ることができる良い例です。

114: Socket774 (ワッチョイ 2773-9akW) 2020/09/03(木) 19:41:42.52 ID:TCPvEOO70
数学のスループットを2倍にするには、それをサポートするデータパスを2倍にする必要があったため、
Ampere SMはSMの共有メモリとL1キャッシュの性能も2倍にしました。
(Turingでは64バイト/クロックに対してAmpere SMでは128バイト/クロック)。
GeForce RTX 3080 の総 L1 帯域幅は 219 GB/秒であるのに対し、GeForce RTX 2080 Super は 116 GB/秒である。

先行のNVIDIA GPUと同様に、Ampereは、グラフィックス処理クラスタ(GPC)、テクスチャ処理クラスタ(TPC)、
ストリーミングマルチプロセッサ(SM)、ラスター演算子(ROPS)、およびメモリコントローラで構成されています。

GPC は、主要なグラフィックス処理ユニットのすべてが GPC 内に配置されている主要な高レベルハードウェアブロックです。
各GPCには専用のラスターエンジンが含まれており、
現在では、NVIDIA Ampere Architecture GA10x GPUの新機能である2つのROPパーティション(各パーティションには8つのROPユニットが含まれています)も含まれています。
NVIDIA Ampereアーキテクチャの詳細については、近日中に発表されるNVIDIAのAmpereアーキテクチャホワイトペーパーに掲載されています。

131: Socket774 (ワッチョイ c7b1-XrX+) 2020/09/03(木) 19:52:05.39 ID:WAlmrRjO0
しかしアンペアのCUDAコア数は、どっか詐欺要素がありそうw

往年のプロセスルールの数値の呼称も、ほぼ詐欺みたいな状況だし、
アンペアのCUDAコア数の数え方も、なんか怪しいわ

137: Socket774 (ワッチョイ ff1f-kjUA) 2020/09/03(木) 19:55:34.61 ID:5pKv+kOV0
>>131
keplerのときもコアが3倍になってるのに性能は3倍になってない!詐欺だ!みたいにいってた口か?
というかコア数より性能ちゃんと見ろよ 伸びてるぞ

142: Socket774 (ワッチョイ c7b1-XrX+) 2020/09/03(木) 20:00:49.80 ID:WAlmrRjO0
ほんと、最近のグラボ関連の数値って、TFLOPSにプロセスルール、CUDAコア数と、
実性能を知る上で参考にならない詐欺みたいな数値ばかりだなw

155: Socket774 (ワッチョイ 2773-9akW) 2020/09/03(木) 20:06:32.88 ID:TCPvEOO70
Cuda core中のFP32 unitが2倍になった
バスの拡張もされている、キャッシュも倍

厳密にはTuringでint32増えたブロックにFp32 unitをついか
Fp32*2かFp32+int32の同時処理が可能

169: Socket774 (ワッチョイ e776-Q4or) 2020/09/03(木) 20:14:52.62 ID:ln8Raw7T0
>>155
たぶんturing方式と違って汎用性あると思うんだよな

104: Socket774 (ワッチョイ 2773-9akW) 2020/09/03(木) 19:37:10.15 ID:TCPvEOO70

115: Socket774 (ワイモマー MM7f-MCEG) 2020/09/03(木) 19:42:22.70 ID:LYmOQOSXM
>>104
VRにDLSSくるー!

120: Socket774 (ワッチョイ bfc6-XrX+) 2020/09/03(木) 19:46:58.73 ID:jmLz6rxy0
>>104
VRにDLSSついに来たか・・
ただ汎用的に使えないと対応するのはビックタイトルのみだろうな・・

162: Socket774 (ワッチョイ bfc6-XrX+) 2020/09/03(木) 20:11:57.11 ID:jmLz6rxy0
>>104より
PCIe 3.0はRTX 3090をボトルネックにしますか? 私のIntelシステムは4.0をサポートしていないので心配です。

Tony Tamasi ?システムのパフォーマンスは多くの要因の影響を受け、その影響はアプリケーションによって異なります。
x16 PCIE 4.0からx16 PCIE 3.0への影響は通常、数パーセント未満です。 CPUの選択は、パフォーマンスに大きな影響を与えることがよくあります。
Gen4の機能を最大限に活用してパフォーマンスを向上できる新しいプラットフォームを期待しています。

みたいだからそこまでPCIE 4.0に拘るまだなさそうだ
これからどんどんか良いの出るだろうしな

193: Socket774 (ワッチョイ 7fdc-Zh5B) 2020/09/03(木) 20:32:05.20 ID:/ko/FyQA0
>>162
RTX IO。
といっても、21年に提供予定だから、Gen4を気にするのは22年に出るであろうhopperからでいいだろうね。

196: Socket774 (ワッチョイ bfc6-XrX+) 2020/09/03(木) 20:35:39.28 ID:jmLz6rxy0
>>193
RTX IOが普通に安定して使えるようになったら、買い替え検討するレベルでもいいと思うよね・・
cpuの方が圧倒的に影響出るみたいだし

158: Socket774 (ワッチョイ 5f73-bPxX) 2020/09/03(木) 20:08:33.18 ID:hqqT8TqA0
VRは内部解像度200%とかやるのにパワー喰いすぎだから
DLSS対応には期待しかない
FoveatedRenderingより効果あったりして

171: Socket774 (ワッチョイ 5f82-aZLl) 2020/09/03(木) 20:16:00.50 ID:yTiR22yO0
>>158
内部解像度上げまくっても画質の改善効果は微々たるもの
それよりもパネルの解像度上げてたHMDバンバン出して欲しいわ

179: Socket774 (ワッチョイ bfc6-XrX+) 2020/09/03(木) 20:20:00.44 ID:jmLz6rxy0
>>171
文字とかオブジェクトの輪郭は現変するけどな(100%~200%くらいまで上げた場合)
そりゃネイティブ解像度上げた方が良いのは確かだけどね

187: Socket774 (ワッチョイ 5f73-bPxX) 2020/09/03(木) 20:26:00.54 ID:hqqT8TqA0
>>171
最低150%は欲しいし結構表示は違うと思う
4kVRに内部解像度200%欲しいので結構つらい

198: Socket774 (ワッチョイ 5f82-aZLl) 2020/09/03(木) 20:37:27.84 ID:yTiR22yO0
>>187
Reverb使って思ったんだけどパネルの解像度が上がると内部解像度上げた時の費用対効果がクソ悪化する
片目4kのパネルが登場したら内部解像度100%でも不満無くなると思うわ

138: Socket774 (ワッチョイ 7fed-5Jfx) 2020/09/03(木) 19:56:34.21 ID:/yF/Egf40
今後VRとか考えると3080や3090買っといた方がいいまである

148: Socket774 (ワッチョイ 5f82-aZLl) 2020/09/03(木) 20:02:59.83 ID:yTiR22yO0
>>138
HMDがねえ

185: Socket774 (ワッチョイ 5f56-hMxR) 2020/09/03(木) 20:24:29.95 ID:ZYP4q0cL0
>>138
その、今後になるときにはもっと良いものが出てるんじゃね?
VRはその時のスペックで楽しむ物な気がする。

188: Socket774 (ワッチョイ bfc6-XrX+) 2020/09/03(木) 20:26:58.17 ID:jmLz6rxy0
>>185
それを言っちゃ永遠にグラボ買えなくなりそうw