クラウドコンピュート

GPUインスタンス じーぴーゆーいんすたんす

GPU機械学習AINVIDIA深層学習推論
GPUインスタンスについて教えて

簡単に言うとこんな感じ!

AI・機械学習・動画レンダリングなどの大量並列計算に特化したクラウドサーバーのこと。CPUが「万能の職人1人」ならGPUは「専門の工員を何千人も」並べるイメージ。生成AIブームで需要が爆増してるよ。


GPUインスタンスとは

GPUインスタンス(GPU Instance)とは、GPU(Graphics Processing Unit)を搭載したクラウドの仮想マシンまたはベアメタルサーバーです。CPUが汎用的な処理に適しているのに対し、GPUは数千〜数万のコアを持ち大規模な並列処理を得意とします。

もともとは3Dグラフィックスのレンダリング用に開発されたGPUですが、その並列処理能力が機械学習・ディープラーニングの行列演算に適していることが2010年代初頭に判明し、AI学習・推論の主力ハードウェアになりました。

現在、生成AI(ChatGPT、Stable Diffusionなど)の急増によりGPUインスタンスの需要が供給を大幅に超過しており、最新GPUインスタンスの入手困難・価格高騰が続いています。


主要GPUインスタンスの比較

クラウドインスタンスGPU主な用途
AWSp4d.24xlargeNVIDIA A100×8大規模AI学習
AWSg5.xlarge〜48xlargeNVIDIA A10G推論・グラフィック
AWSinf2(Inferentia2)AWS独自推論チップ低コスト推論
AzureNC A100 v4シリーズNVIDIA A100AI学習
AzureNV A10 v5シリーズNVIDIA A10仮想デスクトップ
GCPA100 40GB/80GBNVIDIA A100AI学習・HPC
GCPTPU v4/v5Google独自TPUTensorFlow最適化

GPU vs CPU の違い

項目CPUGPU
コア数数コア〜数十コア数千〜数万コア
得意な処理複雑なシリアル処理単純な並列処理
メモリ帯域幅低〜中極めて高い
行列演算性能非常に高い
用途汎用計算・OSAI/ML・画像処理・物理シミュレーション

歴史と背景

2007年にNVIDIAがCUDA(Compute Unified Device Architecture)を公開し、GPUを汎用計算に使えるプラットフォームを提供しました。2012年にトロント大学のAlexNetがImageNet画像認識コンテストで圧勝し、ディープラーニング×GPUの組み合わせが世界の注目を集めました。

AWSは2014年頃からGPUインスタンス(G2シリーズ)を提供開始。2022年のChatGPT登場以降、GPUの需要が爆発的に増大し、2023〜2024年はNVIDIA H100の入手難・価格高騰が深刻な問題となっています。これを受け、AWS(Trainium/Inferentia)・Google(TPU)・Microsoft(Maia)など各クラウドが独自AIチップの開発を進めています。


GPU利用の用途別選定

GPU用途別の選定ガイド AI学習 大規模モデル のトレーニング → A100/H100 マルチGPU p4d.24xl等 AI推論 学習済みモデルの 本番稼働 → A10G/T4 Inferentia2 コスト重視で選択 動画・3DCG レンダリング 動画エンコード → G5 (A10G) メディア処理 向けインスタンス 仮想デスクトップ CAD・デザイン ゲームストリーミング → NV/G系 NVIDIA GRID ライセンス必要

関連する規格・RFC

規格内容
NVIDIA CUDAGPUプログラミングの主要フレームワーク
OpenCLベンダー中立のGPU/CPU並列計算標準
ROCmAMDのオープンソースGPUコンピュート

関連用語