ニュース
「GTC Japan 2012」基調講演レポート。KeplerでNVIDIAはGPUクラウドを推進する
昨年の「GTC Workshop Japan 2011」以来,“日本のGTCローカルイベント”としては2度めの開催となったGTC Japan 2012。今年は計47セッションと,昨年と比べて20近くもセッション数が増えている。
また,会場は昨年と同じ東京・六本木の東京ミッドタウンだが,セッション数が増えたことに伴い,昨年は利用していなかった3F会議室も使うなど,規模はかなり大きくなった印象だ。実際,会場の“入り”も,昨年と比べてかなり多くなったように感じられる。
NVIDIAは今回,「日本最大のGPUコンピューティングイベント」というキーワードを何度も繰り返していたが,確かにそう強調したくなるだけの規模になってきたとはいえるかもしれない。
GTC 2012“本家”から間もない開催ということもあり,講演のこれといった新情報はなかったのだが,4Gamer的に注目したいポイントを中心に,筆者なりのコメントを交えつつレポートしてみたいと思う。
28万体もの多体シミュレーションを
こなすGK110
4Gamer読者にはあらためて紹介するまでもないだろうが,NVIDIAは現在,Keplerアーキテクチャを採用したGPU製品を展開中だ。GTCでの主なテーマとなるGPUコンピューティング向けには,「GK104」コアを採用する「Tesla K10」がすでに出荷済みである。
ただし,3D性能を重視した設計のGK104コアはHPC(High Performance Computing)向けではなく,そのためHPCの世界では,倍精度浮動小数点演算性能の強化が図られた「GK110」を搭載する「Tesla K20」が本命だ。基調講演でScott氏はTesla K20について「第4四半期に提供開始予定」であることに変更はないと繰り返していたが,現時点での性能は期待どおりのものが出ているとのことである。
またScott氏は,Tesla K20の採用が決まっている米オークリッジ国立研究所のスーパーコンピュータ「Titan Cray XK6」に向けた納入計画も順調と語っていた。GK110コアはGeForceにも転用されると噂されているので,その動向を追っている読者も少なくないと思われるが,この調子なら,2013年の早いタイミングで搭載グラフィックスカードが出てきても不思議ではないだろう。
Kepler世代のGPUにおける新機能の1つに,ダイナミック並列処理(Dynamic Parallelism)というものがあるが,これを用いた多体シミュレーションのデモも,GTC Japan 2012では披露されている。
下に示したのがその直撮りムービーだ。デモ自体は5月のGTC 2012で披露されたものだが,やはり実際に動く様子はインパクトがある。
このデモに先立って,Fermi世代のGPUでは4万体の多体シミュレーションを行っていたことも示したScott氏は,「当時は4万体でも驚いたものだが,このデモは28万体だ」と,GK110コアの性能をアピールしている。
ただ,数字だけで比較できるほど,話は簡単ではない。今回の銀河衝突デモは,Fermi世代で用いられたアルゴリズムとは異なるものが使われているとのことだからだ。
具体的には,「Barnes-Hut Tree」法という,空間を16の物体を含むメッシュに分割し相互作用を計算するものが用いられているそうで,簡単にいえば,Kepler世代のGPUに実装されたダイナミック並列処理を,徹底的に活用したものということになる。「このコードは(GPU側でスレッド生成が行えるダイナミック並列処理が行えないと実装しづらいアルゴリズムであるため)Fermiのときはエンジニアが長い時間をかけて移植したものだが,Kepler用には週末のわずかな時間しかかからなかった」(Scott氏)とのことで,ダイナミック並列処理の威力を窺えよう。
NVIDIAはクラウド市場に本気
GeForce GRIDはまだ半信半疑か
4Gamerの読者が注目するのは,やはりゲームのストリーミングサービスを実現する「GeForce GRID」だろう。Scott氏もGeForce GRIDについては時間を割いて紹介していたが,気になるのはレイテンシだ。
Scott氏はこの点について,「人間の反応には200msかかる。したがって,200ms以内なら十分だ」と語り,ゲームコンソールと比較しつつ低レイテンシを強調していたのだが,さすがに200ms(≒12フレーム)はあり得ないという読者は多いはず。また,ゲームコンソールのパイプラインに100ms(≒6フレーム)かかるという点にも首をかしげる人は多いように思う。「問題がない」ことのアピールを急ぐあまり,相当に古い世代のゲーム機を比較対象にしてしまっているように思えた。
少なくとも,GeForce GRIDの150ms超(≒9フレーム超)という数字を素直に解釈するなら,リアルタイム性が強いアクションゲームをプレイするのはかなり厳しいだろう。
ただ,クライアント側の端末を問わず,タブレットやスマートフォン,スマートテレビでも最新世代のゲームをプレイできるようになる可能性そのものは,やはり魅力的だ。最終的なサービスで,どの程度の遅延に落ち着くのか,現時点では期待半分,不安半分といったところである。
実のところ,NVIDIAは数年前から,GPUをデータセンターへ導入する方向を模索しており,データベースのGPUの応用といった研究を支援したりもしていたが,なかなかデータセンターに進出できなかったという経緯がある。それだけにGPU仮想化は,そんな積年の目標を実現するキーテクノロジーと見ているのだろう。実際,成功すれば大きなビジネスになることはほぼ間違いなく,GeForce GRIDが“使える”かどうかも含めて,今後の展開には注視しておきたいところだ。
GPUコンピューティングの世界で活躍する
日本の研究者も登壇
GTC Japan 2012のテーマであるGPUベースのHPC分野では日本が先行しているため,多数の研究者が活躍している。
基調講演でも,そんな研究者が招かれて登壇し,研究内容を紹介する場面があった。
密結合の並列計算機である「HA-PACS/TCA」では,独自の高速通信技術を用いてGPUクラスタを構築しているそうだ。通信にPCI Expressを用いているというのは興味深い。
登壇した青木氏は,2011年に青木氏らのグループが受賞したゴードンベル賞――スーパーコンピュータにおけるノーベル賞ともいえる賞――に触れ「多くの人の力でゴードンベル賞の特別賞を受賞することができた。ちなみに,特別賞という名前だけれども,本賞と同じ(笑)」と語っていた。
以前,筆者が話を聞いたときも,青木教授は,日本語訳だと格下に聞こえかねない「特別賞」という名称を気にしていたが,これは歴とした本賞である。GPUを使ったスーパーコンピュータで国際的な業績をあげている研究者がいるということは,日本人として覚えておきたいところだ。
というわけで,新情報こそほとんどないものの,熱気は感じられたGTC Japan 2012。Intelが「Xeon Phi」を発表し,AMDも「Heterogeneous System Architecture」の予告を行うなど,後続集団が動き始めたタイミングではあるが,先行するNVIDIAがGPUコンピューティングの市場をどれだけ広げていくのか,興味は尽きない。
GTC Japan 2012公式ページ
- 関連タイトル:
NVIDIA RTX,Quadro,Tesla
- この記事のURL:
キーワード
Copyright(C)2010 NVIDIA Corporation