お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2012/12/11 16:23

イベント

ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか

画像集#002のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか
 2012年12月6日,英ARMの日本法人であるアーム主催の技術者向けイベント「ARM Technology Symposium 2012」が都内で開催された。省電力のコアと高性能コアを組み合わせる「big.LITTLE」戦略が大々的に語られた昨年と比べると華々しさは欠くものの,セッションには実践的なものが多かったので,今回は,そのなかからとくに興味深い話題をまとめて紹介してみたいと思う。


ARMアーキテクチャの普及を加速させる「ハードマクロ」とは何か。「IP」をおさらいしてみる


 4Gamer読者にはあらためて紹介するまでもないだろうが,スマートフォンやタブレットの分野は,ARMのアプリケーションプロセッサIPコア「Cortex-A」シリーズが支配しているといってもいい状況だ。CPUの巨人であるIntelも,ARMが支配している本分野への参入を試みているが,いまのところ成功しているとは言いがたい。
 ARMとIntelの違いはいろいろあるが,最大のものは,ARMがCPUやGPUのIP(Intellectual Property,知的財産権)のライセンスをLSIメーカーに販売するビジネスを展開しており,Intelのように,ARM自体が半導体を製造・販売しているわけではない。

 では,IPとは何か。平たく言えばCPUやGPUの設計図のようなものだが,この「設計図」にはいくつかのレベルがある。ARMが用意しているのは3つだ。

「電力効率に最適化した高性能Cortex-A15プロセッサ実装での課題とヒント」というセッションを担当した野尻尚稔氏(アーム 応用技術部 シニアFAE)
画像集#013のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか
 そのなかで,最も基本的な設計図は「回路図」となる。
 回路図というのは,素子と素子との接続を示したもので,CPUやGPUのようなLSIにおいては,専用の言語「HDL」(Hardware Description Language)などを用いて記述される。聞いたことのない単語だらけでさっぱり,という人もいると思うが,誤解を恐れずにざっくりまとめるなら,回路図というのは,ソフトウェアで記述された設計図だ。
 そして専門用語では,CPUコアやGPUコアといった機能を持つ回路のことを「マクロ」(macro)と呼ぶことから,回路図のことを「ソフトマクロ」と呼んだりもする。

 ARMはこのソフトマクロによるIPの提供形態を「ARM RTL」(ARM Register Transfer Level)と呼んでいるが,ARMアーキテクチャに基づいたSoC(System-on-Chip)を開発するメーカーのうち,ARM RTLを入手したメーカーは,EDA(Electronic Design Automation,半導体設計作業自動化ソフトウェア&ハードウェアの総称)にARM RTL(≒ソフトマクロ)を取り込んで,自社のSoCを設計するといったことを行っている。

 ソフトマクロの利点は,IPの提供を受けた側,つまりSoCメーカー側の自由度が大きい点だ。機能や性能,消費電力といった部分にまで踏み込んで,柔軟なカスタマイズを加えることができる。
 一方で,デザインの自由が大きい分だけ,最終的なLSIの設計に落としこむまでに多くの作業が必要になり,いきおい,時間も多くかかる。

 「電力効率に最適化した高性能Cortex-A15プロセッサ実装での課題とヒント」というセッションでは,作業量が,プロセス技術の微細化に伴って劇的に増加してきているということも語られた。
 下に示したスライドは,SoCを設計する工程の中から3種類を抽出して「製造プロセスの微細化によって作業量がどの程度増加するか」を見積もったものだが,プロセスが微細化すればLSIは複雑になり,作業量が増すという単純な話でもある。その分だけ開発期間が長くなり,コストも高くなるというわけだ。

左から順に「DRC」(Design Rule Check,設計がデザインルールに合っているかどうかのチェック),タイミング解析(Timing Corner,信号のタイミングがシビアな部分)の数,セルライブラリ(Lib Cell,LSIを構成する機能ブロック)の数で,比較に用いられているのは40nmと28nmの両プロセスだ。縦軸は数で,40nmから28nmへ移行すると,それだけ設計が複雑になる
画像集#003のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか

 いくつかあるIP(設計図)の2種類めは,ARM独自の「ARM Processor Optimization Pack」(以下,ARM POP)だ。ARM POPは“ソフトマクロを一歩進めた”といえる「物理IP」だ。
 「物理」とされる由来は,ARM POPが,LSIのレイアウト設計を含むライブラリとなっていること。要するに,“設計が途中まで済んでいる”ので,純粋なソフトマクロと比べると,SoCに落とし込むまでの作業量を低減できるのが特徴だ。

 ただ,「それでも,製造プロセスやトランジスタの選択といったことがSoC設計者側に任されるため,それなりの作業量が発生する」(ARM)。
 具体的な例として,今回のセッションでは,トランジスタのしきい電圧(Vt)とチャネル長の選択でリーク電流が大きく変わるという例が紹介されていた。

ARM POPではトランジスタのしきい電圧(Vt)やチャネル長にさまざまな選択肢があるため,その選択によって消費電力や性能が左右されるという。SoC製品のPPA(Power Performance Areaの略だそうだ)に多大な影響があるため,最適な選択は非常に難しいとのこと
画像集#004のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか

 下に示した2つのグラフは,Vtやチャネル長の選択で,動作クロック(≒性能)と消費電力の組み合わせをさまざまに取れるという例で,これを狙ったところに持って行くのは大変難しいとのこと。ARM POPでも,先ほど紹介したソフトマクロでも,狙った性能と消費電力を実現するためには相応の人月がかかるわけだ。

画像集#005のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか
グラフには2種類のVtが記されている。茶色い線が標準Vt(rVt),紫の線が低Vt(lVt)だ。Vtごと3つのチャネル長がプロットされ,線で結ばれている。rVtと比べてlVtでは動作クロック(横軸)が上がり性能も28%上昇するが,リーク電流(縦軸)は最大4.3倍にまで達してしまう
画像集#006のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか
このグラフは,rVtでチャネル長を変え,わずかにクロックを低下させるだけで,リーク電流は先ほどの2分の1で済むという例を示したもの

 以上の事情から,近年利用が増えてきているのが,第3のIPとなる「ハードマクロ」だそうだ。
 ソフトマクロの対義語然とした響きから,何となく想像できるのではないかと思うが,ハードウェアマクロというのは,製造プロセスを含む,CPUコアやGPUコアの設計図一式である。SoCメーカーがカスタマイズできる範囲は相当に狭くなるが,その代わり,SoCの開発・製造にかかる時間を著しく短縮できるというメリットがある。

ARM RTL(=ソフトマクロ)やARM POPを購入し,中央の青い枠で囲まれた作業をこなしていけば,メーカーの独自性を強く出しながらのSoC開発を行えるが,相応の人月とコストがかかる。対してハードマクロを使えば,開発期間を大きく短縮できるという
画像集#007のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか

 ARMでは,現行世代のCPU IPコアで,big.LITTLE処理におけるbigのほうを担当する「Cortex-A15」において,クアッドコアのハードマクロ製品「Seahawk」(シーホーク)を用意している。「電力効率に最適化した高性能Cortex-A15プロセッサ実装での課題とヒント」というセッションの内容によれば,Seahawkは,Vtやチャネル長などについて「妥当な選択が行われて」おり,さまざまなPPA,つまり「クアッドコアCortex-A15」でターゲットとなる性能や消費電力のさまざまなレンジをカバーできるものになっているとのことだ。


■ARMのIPを使ったSoCはどれくらいの期間で開発されているのか

 以上,ARMは3つのレベルでIPを供給しているわけだが,具体的にARMのIPを使ったSoC製品はどれくらいの期間をかけて開発されているのだろうか。GPUに関するセションでMaliを用いた成功例として興味深い事例が紹介されていたので紹介しておこう。

 下のスライドに挙げられているのは,中国のLSIメーカー・Allwinner Technology(全志科技有限公司)によるSoC「Allwinner-A10」だ。CPUに「Cortex-A8」をシングルコアで用い,GPUとして「Mali-400」を組み合わせてきたモデルとなる。一時,中国製格安タブレット,俗に言う「中華タブ」の多くで採用されたSoCなので,聞いたことがあるという読者もいるのではないかと思われるが,このSoCは,設計開始からわずか7か月でLSIの出荷にこぎ着け,そこから2か月で,搭載製品の製造も始まったそうだ。
 この例はMaliのIPを用いてマーケットに早期似た製品が投入できた成功例として語られているので,とりわけ開発期間が短かったものと思われるが,設計から1年かからずに投入されているSoC製品もあるわけである。

Allwinner-A10というSoCは,設計からわずか7ヶ月でLSIが出荷され,さらにわずか2か月で最終製品たるタブレット端末も登場したという
画像集#008のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか

 2012年になって中華タブもデュアルコアが主流となり,RockChip(瑞芯微電子有限公司)のSoCに人気が移っているが,RockChipのSoCもARMから各種IP製品の提供を受け,短期間で設計されたものと考えられる。こういった部分が価格競争力につながっているのだろう。

 ARMが提供するIP製品は豊富であり,多くのメーカーが,それらを使ってSoC製品を投入してくる。ARMは「One Size Does Not Fit All」というキーワードを繰り返しているが,さまざまな機能や性能,消費電力帯を多数のSoCでカバーしていることこそが,同社の強みなのだ。


Mali T-600シリーズのGPGPU性能もアピール


 さて,前段でも紹介したとおり,ARMはGPUコアIPシリーズとして「Mali」も展開している。現在のラインナップは,大別すると,Mali-400シリーズとMali-T600シリーズの2種類だ。

 「次世代ビジュアルコンピューティングの展望」と題されたセッションではMaliの成功が語られていたが,ARMによれば,Mali-400シリーズは20以上のライセンスが販売され,スマートフォン市場で20%のシェアを獲得しているほか,タブレット市場でもトップシェアにあるという。
 国内でタブレットのGPUというと,AppleのAシリーズに統合される「PowerVR」か,Tegra 3の「Ultra Low Power GeForce」というイメージが強いのではないかと思われるが,中国製タブレットの市場ではMali-400が席巻したりするそうなので,総計ではMaliがトップシェアを握っているということなのだろう。

すでに多数SoCで採用実績のあるMali-400シリーズ。2012年6月には新しいIP製品として「Mali-450MP」も追加されている。Mali-450MPは,Mali-400比で最大2倍の性能をとなる最大8コアのGPUで,4K2K解像度のサポートが大きな特徴だ
画像集#009のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか

ARMの想定するGPGPU用途
画像集#010のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか
 さて,ARM Technology Symposium 2012における主役のGPUは,これから普及期に入るMali-T600シリーズのほうだ。
 Mali-T600シリーズにおける最大の特徴はGPGPUのサポートで,ARMでは当初,パノラマ撮影の画像合成や,顔認識,ランドマークの認識,画像処理&編集といった分野での応用を想定しているとのこと。こういった処理では,CPUよりもGPUを用いたほうが消費電力は少なくて済むため,応用が進むと見ているようである。

Mali-T600シリーズの最大の特徴はスライド冒頭で挙げられているGPGPUのサポートだ。ちなみにARMは,イベントでOpenCL関連のセッションを用意し,「2013年からはOpenCLがキーワードになる」とも述べていたが,現在のOpenCL利用状況を見る限り,ARMが予告するとおりにOpenCLが脚光を浴びるかどうかには疑問も残る
画像集#011のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか

 GPUをGPGPU用途で用いるときに課題となるのが「グラフィックス処理と汎用演算処理をいかに調整するか」で,Mali-T600シリーズでは「Job Manager」(ジョブマネージャ)がシェーダコアに対して発行するジョブを調整しているという。
 ARMは,「GPUでは今後,Job Managerの設計が重要になる」との見通しを示していたが,おそらくそれだけではなく,ソフトウェア側の対応も必要になるだろう。同じことはすでにPCゲームで課題となっているので,それが今後はモバイルでも課題になってくるということだ。

ドライバを介して,GPGPUのジョブとグラフィックスのジョブがGPUに送られてくると,Mali-T600シリーズでは,タスクにまとめてシェーダコアに発行する調整役をJob Manager担っている
画像集#012のサムネイル/ARMのプロセッサIPは「ハードマクロ」でさらなる普及へ〜「ハードマクロ」とは何なのか

 GPGPUに対応したMali-T600シリーズは将来の製品ではなく,すでに「Mali-T604」がSamsung ElectronicsのSoC「Exynos 5」に統合され,最終製品としてAndroidタブレット「Nexus 10」や,Chrome OS搭載端末「Chromebook」も登場してきている。2013年になれば,Mali-T600シリーズを統合するSoCが載ったスマートフォンやタブレットも次々と登場してくるだろう。
 Maliの勢力拡大に合わせて,ARMが予告するとおりにOpenCLが注目されるようになるのかも含めて,今後もモバイルデバイスのプロセッサ周りは見どころが多い印象だ。

ARM公式Webサイト

  • 関連タイトル:

    Cortex-A

  • 関連タイトル:

    Mali,Immortalis

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
スペシャルコンテンツ
注目記事ランキング
集計:11月28日〜11月29日