ハイパーパラメータ はいぱーぱらめーた
ハイパーパラメータ学習率バッチサイズモデル設計チューニング機械学習
ハイパーパラメータについて教えて
ハイパーパラメータとは
ハイパーパラメータ(Hyperparameter) とは、機械学習モデルの学習が始まる前に人間が設定する制御パラメータのことです。モデルの重みやバイアスのような「学習データから自動的に決まるパラメータ」とは区別されます。
学習結果の良し悪しはハイパーパラメータの設定に大きく左右されます。例えば学習率が大きすぎると発散し、小さすぎると学習が遅い——最適なハイパーパラメータを見つける作業が「ハイパーパラメータチューニング」 です。
ハイパーパラメータはモデルの種類によって異なりますが、深層学習では「学習率・バッチサイズ・エポック数・層の数・ニューロン数」などが主要なものとして知られています。
主なハイパーパラメータの一覧
| 種類 | 具体例 | 説明 |
|---|---|---|
| 最適化関連 | 学習率、β₁、β₂、ε | 最適化アルゴリズムの動作を制御 |
| 学習プロセス | バッチサイズ、エポック数 | 学習の実行方法を制御 |
| モデル構造 | 層の数、ニューロン数、フィルタ数 | ネットワークの規模・形状 |
| 正則化 | ドロップアウト率、L2正則化係数 | 過学習を防ぐためのパラメータ |
| スケジューリング | ウォームアップステップ数、アニーリング期間 | 学習率の変化パターン |
歴史と背景
- 機械学習初期:少ないハイパーパラメータを手動で探索することが多かった
- 2010年代:深層学習の複雑化に伴い、ハイパーパラメータ数が増加。チューニングが困難に
- 2012年:ランダムサーチがグリッドサーチより有効と示される(Bergstraら)
- 2019年:OptunaなどTPE(Tree-structured Parzen Estimator)を使った自動化が普及
パラメータとハイパーパラメータの違い
| 区分 | 定義 | 決め方 | 例 |
|---|---|---|---|
| パラメータ | 学習中に自動調整される値 | 学習アルゴリズムで決定 | 重み(W)、バイアス(b) |
| ハイパーパラメータ | 学習前に人間が設定する値 | 手動またはチューニングで決定 | 学習率、層数、バッチサイズ |
ハイパーパラメータの探索方法
| 方法 | 特徴 |
|---|---|
| グリッドサーチ | 候補値の全組み合わせを試す。確実だが計算量が多い |
| ランダムサーチ | ランダムに組み合わせを試す。グリッドより効率的 |
| ベイズ最適化 | 過去の結果を活用して次の探索点を決定。効率的 |
| ハイパーバンド | 有望でない試行を早期打ち切り。計算コスト削減 |
関連用語
- ハイパーパラメータチューニング — 最適なハイパーパラメータを探す技術
- Optuna — 自動ハイパーパラメータ最適化フレームワーク
- ベイズ最適化 — 効率的なハイパーパラメータ探索手法
- 学習率スケジューリング — 最重要ハイパーパラメータの1つである学習率の制御