Tegra
てぐら
NVIDIA Tegraとは米NVIDIA社が開発しているモバイルプロセッサ(SoC)である。
モバイルSoCと言えば他にAppleのAシリーズ(iPhoneやiPadに搭載。同社製品専用で外販はされていない)や、QualcommのSnapdragon(GalaxyやXperiaなどに搭載されている)、HisiliconのKirin(Huawei社の端末に搭載されている)などが有名だが、TegraはPC向けグラフィックボード「GeForce」シリーズ等古くからGPUの開発を手掛けてきたNVIDIAのモバイルSoC故に、グラフィック性能に比重が置かれているのが特徴。
2008年頃に最初のTegraとして「Tegra APX」シリーズが発表。
2015年に発表された「Tegra X1」はFP16モードにてモバイルSoCで初めて1TFLOPSもの演算能力を実現したことと、任天堂の家庭用ゲーム機「Nintendo Switch」に同プロセッサのカスタマイズ品が搭載されたことで有名である。
Tegra APX
CPU | ARM11 | 600MHz |
---|---|---|
GPU | Geforce ULV |
CPUにARM11系プロセッサを搭載。GPUはモバイル向けにカスタマイズされた超省電力(Ultra Low Voltage)のGeforceアーキテクチャのコアを採用し、プログラマブルシェーダに対応している。動画再生は720pまで対応。
Tegra 2
CPU | ARM Cortex-A9 | 1.0~1.2GHz 2コア |
---|---|---|
GPU | Geforce ULV | 300~400MHz |
プロセス | 40nm |
CPUに2コアのARM Cortex-A9を採用。GPUはAPX・600シリーズからパワーアップした超省電力GeforceアーキテクチャのGPUを採用している。また、世界初のマルチコアARM Cortex-A9搭載を実現したSoCでもある。
かつてNintendo 3DSに採用されるとの噂が流れていたが電力効率の問題でお蔵入りになったというエピソードがある。
Tegra 3
CPU | ARM Cortex-A9+低消費電力コア | 1.2~1.7GHz 4コア+1コア |
---|---|---|
GPU | Geforce ULV | 416~520MHz |
プロセス | 40nm |
メインのCPUは2と同じくARM Cortex-A9(4コア)を搭載し、それに追加するかたちで新たに省電力のコアを1つ搭載している。CPU負荷が軽い処理はこの省電力のコア一つで処理することでバッテリーを長持ちさせることができる(4-PLUS-1技術と呼ばれている。)とのこと。家庭用Androidゲーム機「OUYA」に採用された。
Tegra 4
CPU | ARM Cortex-A15+低消費電力コア | 最大1.9GHz 4コア+1コア |
---|---|---|
GPU | Geforce ULV | 672MHz 72コア |
プロセス | 28nm |
CPUがARM Cortex-A15に、GPUのコア数が72コアに増量されるなど全体的なパワーアップが施された。3の4-PLUS-1技術も続投されている。NVIDIA自社製の携帯ゲーム機「NVIDIA Shield Portable」等に採用された。
Tegra K1
CPU(32bit版) | ARM Cortex-A15 R3+低消費電力コア | 最大2.3GHz 4コア+1コア |
---|---|---|
CPU(64bit版) | Nvidia Denver | 最大2.5GHz 2コア |
GPU | Nvidia Kepler CUDAコア(GK20A) | 756~951MHz 192コア |
演算能力 | 290~365GFLOPS | |
プロセス | 28nm |
GPUがこれまでに採用された独自仕様の超省電力プロセッサから当時最新のGeforceに採用されたKeplerアーキテクチャのCUDAコアに変更された。(ただしモバイル向けにいくつか改良されている。)
「K1」の名の由来は上述した「Kepler」の頭文字より。モバイルSoCらしく電力効率が高く(GPUの性能だけ見れば)PS3/XBOX360を超える性能を持っておきながら僅か8Wで動作するとのこと。32bit版と64bit版が存在し、32bit版のCPUはこれまで通り4+1コア構成(Cortex-A15 R3)で、64bit版のCPUはNVIDIA自社製の「Denver」(ARM系のカスタマイズコア)を2コア搭載している。
採用例はAndroidゲーム機「NVIDIA Shield Tablet」、NVIDIA自社製の小型の開発キット「Jetson」等。
Tegra X1(Tegra X1+)
CPU | ARM Cortex-A57+ARM Cortex-A53 | 1.9GHz 4コア+1.3GHz 4コア |
---|---|---|
GPU | Nvidia Maxwell CUDAコア(GM20B) | 1000【1267】MHz 256コア |
演算能力(FP32) | 512【649】GFLOPS | |
演算能力(FP16) | 1024【1298】GFLOPS | |
プロセス | 20【16】nm |
※【】内は2019年よりリリースされた「Tegra X1+」の仕様。
CPUが4+1からCortex-A57(4コア)+Cortex-A53(4コア)のbig.LITTLE(高性能コアbigと省電力コアLITTLEの組み合わせ)の8コア構成になり、アーキテクチャも64bitのみになった。
GPUも「Geforce GTX 900」シリーズに搭載されているMaxwell(第2世代)に変更され、DirectX 12やVulkan等最新のゲーム用APIも快適に動作させることが可能。
上述した通りFP16モードにてモバイルSoCでは初の1TFLOPSを実現したSoCである。
X1の名前の由来はGPUのMaxwellより。
頭文字のMではなくXにした理由は「MよりXの方がカッコよかったから。」とのこと。
採用例は据え置き型動画ストリーミング機兼ゲーム機「SHIELD Android TV」、クレジットカード大の開発機「Jetson TX1」、自動運転支援システム「Drive CX & PX」等。
NX-SoC(Tegra X1 Custom)
CPU | ARM Cortex-A57+ARM Cortex-A53 | 1.02GHz(ベースクロック) 4+4コア |
---|---|---|
GPU | Nvidia Maxwell CUDAコア(GM20B) | 307~768MHz 256コア |
演算能力(FP32) | TVモード:393GFLOPS | 携帯モード:157~236GFLOPS |
演算能力(FP16) | TVモード:786GFLOPS | 携帯モード:314~471GFLOPS |
プロセス | 20nm→16nm |
任天堂のゲーム機Nintendo Switchに採用された「カスタマイズされたTegra」。
公式からの仕様は未公表だがある解析サイトによるとベースはTegra X1で、余分な機能を排除して消費電力を下げることで、携帯モード時の限られた電力でも安定してゲームの演算に集中出来るようなカスタマイズを施している。
携帯モードと据え置きモードでクロック周波数が変わる仕組みになっており、携帯モードの場合はバッテリーを持たせるためにおよそ4割程度のパワーになるという。
オリジナルのTegra X1と同じくDirectX 12世代のAPIやVulkan等に対応している。
CPU/GPU共に数値上のスペックがオリジナルのTegra X1から若干下がっているが、ファームウェア、OS、ゲームソフトを動かすミドルウェアやAPI、そしてゲームソフト等のソフトウェアを完全に同プロセッサに最適化させている為、実効性能はオリジナルのTegra X1よりも高くなると思われる。
2019年8月発売の「バッテリー持続時間が長くなった新モデル(通常型)」及び同年9月発売のNintendo_switch_Liteでは、SoCの製造プロセスが20nmから16nmに変更されており、消費電力と発熱量が全体的に下がっている。
これによりバッテリー容量が通常型の4310mAhから3570mAhに減らされたLiteも初期型より長時間稼働させることが可能になっている。
Tegra X2
CPU | Nvidia Denver2+ARM Cortex-A57 | 1.4~2.0GHz 2コア+1.2~2.0GHz 4コア |
---|---|---|
GPU | Nvidia Pascal CUDAコア(GP10B) | 854–1465MHz 256コア |
演算能力(FP32) | 437~750GFLOPS | |
演算能力(FP16) | 874~1500GFLOPS | |
プロセス | 16nm FinFET |
TITAN X等に搭載されているPascalアーキテクチャを積んだTegra。
PascalだがP1ではない。(英語版Wikipediaではこれについて色々揉めたらしい。)
Tegra初のFinFET技術を採用し、電力効率が大きく改善されている。PascalとFinFETの恩恵もあってX1とほぼ同じ消費電力で約1.5倍の性能を誇る。
採用例は「Jetson TX2」、自動運転支援システム「Drive PX2」等。
Xavier
CPU | ARMv8カスタム | 8コア |
---|---|---|
GPU | Nvidia Volta CUDAコア | 512コア |
演算能力(FP32) | 1500GFLOPS | |
演算能力(FP16) | 3000GFLOPS | |
プロセス | 12nm FinFET |
最新のVoltaアーキテクチャのCUDAコアを512コア搭載しており、30ワットでおよそ3TFLOPS(FP16)もの演算能力を誇るのが特徴。
次世代の自動運転システムや、組み込み用のAIコンピューター等に採用される模様。
Orin
CPU | ARM Cortex-A78AE | 最大12コア |
---|---|---|
GPU | NVIDIA Ampere CUDAコア | 最大2048コア |
2019年12月18日に発表(出典:NVIDIA、自律マシン向けの先進のソフトウェア デファインド プラットフォーム、DRIVE AGX Orin を発表)。2022年8月以降、一般購入可能なJetsonモジュール及び開発機の展開が始まっている。
初めて1TFLOPSを実現したコンピューターは上記のTegra X1が発表される約15年前にできたスーパーコンピューターASCI Red。
ただし昔のスパコンゆえに1TFLOPSを実現するのに9298コアのプロセッサ、150平方メートルの敷地、500kWの消費電力を費やしている。ちなみにTegra X1はそれぞれ8+256コア、100円玉大、15W。
「モバイルプロセッサ」と銘打っているが、高い性能のトレードオフとして発熱や消費電力が他のモバイルプロセッサよりも高くなっており、その影響かスマートフォンやタブレットなどの一般的なモバイル機器への採用例は比較的少ない。
とりわけX1以降は自動運転システムやシングルボードコンピュータ等の組み込み機器向けにシフトしだしており、X1以降のプロセッサが採用されたモバイル機器は上記したNintendo Switch(携帯ゲーム機として見た場合)とGoogleのタブレットPC「Pixel C」の二機種のみになっている。