機械学習基礎

ハイパーパラメータ はいぱーぱらめーた

ハイパーパラメータ学習率バッチサイズモデル設計チューニング機械学習
ハイパーパラメータについて教えて

簡単に言うとこんな感じ!

機械学習モデルには「学習で自動的に決まる値(パラメータ)」と「人間が事前に決める値(ハイパーパラメータ)」の2種類があるよ。学習率・層の数・バッチサイズなどがハイパーパラメータ。料理でいうと「レシピ(火加減・時間)」で、材料(データ)をどう調理するかを決める設定だよ!


ハイパーパラメータとは

ハイパーパラメータ(Hyperparameter) とは、機械学習モデルの学習が始まる前に人間が設定する制御パラメータのことです。モデルの重みやバイアスのような「学習データから自動的に決まるパラメータ」とは区別されます。

学習結果の良し悪しはハイパーパラメータの設定に大きく左右されます。例えば学習率が大きすぎると発散し、小さすぎると学習が遅い——最適なハイパーパラメータを見つける作業がハイパーパラメータチューニング です。

ハイパーパラメータはモデルの種類によって異なりますが、深層学習では「学習率・バッチサイズ・エポック数・層の数・ニューロン数」などが主要なものとして知られています。


主なハイパーパラメータの一覧

種類具体例説明
最適化関連学習率、β₁、β₂、ε最適化アルゴリズムの動作を制御
学習プロセスバッチサイズ、エポック数学習の実行方法を制御
モデル構造層の数、ニューロン数、フィルタ数ネットワークの規模・形状
正則化ドロップアウト率、L2正則化係数過学習を防ぐためのパラメータ
スケジューリングウォームアップステップ数、アニーリング期間学習率の変化パターン

歴史と背景

  • 機械学習初期:少ないハイパーパラメータを手動で探索することが多かった
  • 2010年代:深層学習の複雑化に伴い、ハイパーパラメータ数が増加。チューニングが困難に
  • 2012年:ランダムサーチがグリッドサーチより有効と示される(Bergstraら)
  • 2019年OptunaなどTPE(Tree-structured Parzen Estimator)を使った自動化が普及

パラメータとハイパーパラメータの違い

区分定義決め方
パラメータ学習中に自動調整される値学習アルゴリズムで決定重み(W)、バイアス(b)
ハイパーパラメータ学習前に人間が設定する値手動またはチューニングで決定学習率、層数、バッチサイズ

ハイパーパラメータの探索方法

方法特徴
グリッドサーチ候補値の全組み合わせを試す。確実だが計算量が多い
ランダムサーチランダムに組み合わせを試す。グリッドより効率的
ベイズ最適化過去の結果を活用して次の探索点を決定。効率的
ハイパーバンド有望でない試行を早期打ち切り。計算コスト削減

関連用語