ネットワークセキュリティ

暗号化トラフィック分析 あんごうかとらふぃっくぶんせき

暗号化TLSトラフィック解析ETA(Encrypted Traffic Analytics)マルウェア検知フィンガープリンティング
暗号化トラフィック分析について教えて

簡単に言うとこんな感じ!

手紙の中身は読めなくても「封筒の大きさ・送り先・到着時間」でだいたい何を送ったか推測できるよね。暗号化トラフィック分析は、それと同じ発想!通信の中身は見ずに、パケットのサイズや間隔・宛先といった「外側の情報」だけで不審な通信を見つけ出す技術なんだ。


暗号化トラフィック分析とは

近年、企業の通信の大半は TLS(Transport Layer Security) などの暗号化プロトコルで守られています。これ自体は悪いことではありませんが、攻撃者もその「暗号の壁」を利用して、マルウェアの通信やデータ窃取を正規の通信に紛れ込ませるようになりました。従来型のセキュリティ機器(ファイアウォールIDS)は通信の中身を検査して脅威を見つけるため、暗号化された通信に対してはほぼ無力になってしまいます。

暗号化トラフィック分析(Encrypted Traffic Analysis、ETA) は、通信の「中身(ペイロード)」を復号せずに、パケットのサイズ・送受信タイミング・接続先IPアドレスTLSハンドシェイクの特徴 など、通信の「外側」から読み取れるメタデータだけを統計的・機械学習的に分析して、脅威を検出する技術です。

プライバシーを侵害せずにセキュリティを確保できる点が最大の特徴で、Ciscoが提唱した ETA(Encrypted Traffic Analytics)をはじめ、多くのNDR(Network Detection and Response)製品やクラウドセキュリティ基盤に組み込まれています。「中身を見ない」のに「怪しさがわかる」 という、一見矛盾したアプローチです。


分析に使うメタデータの種類

暗号化トラフィック分析が着目する情報は、暗号化されていない「外側」の情報です。

メタデータの種類具体例何がわかるか
パケットの長さと到着間隔(SPLT)最初の数パケットのバイト数の系列アプリ・プロトコルの種類
バイトの分布(BD)パケット内バイト値のヒストグラム暗号方式・エントロピーの特徴
TLSハンドシェイク情報Cipher Suite・拡張・証明書の有効期限正規ソフトかマルウェアかの判別
DNS・SNI情報ドメイン名・サブドメインの長さと乱雑さDGAドメインの検出
フロー統計通信時間・転送量・接続先ポートC2通信・データ持ち出しの兆候
TLSフィンガープリント(JA3など)TLSクライアントの特徴値のハッシュマルウェアファミリーの識別

TLSフィンガープリント(JA3)とは

JA3 は、TLSハンドシェイク時に送られる「ClientHelloメッセージ」の中に含まれる複数のフィールド(TLSバージョン・Cipher Suite・拡張の種類など)を組み合わせてMD5ハッシュ化した文字列です。同じツールやマルウェアは同じJA3値を生成する傾向があるため、「このJA3値は既知のマルウェアと一致する」という形で検知に使えます。

ClientHello の構成フィールド
┌──────────────────────────────────────────────────────┐
│ TLSバージョン + Cipher Suites + Extensions           │
│ + Elliptic Curves + Elliptic Curve Point Formats    │
└──────────────────────────────────────────────────────┘
         ↓ カンマ区切りで連結
"771,49196-49200-159...,0-23-65281...,29-23...,0"
         ↓ MD5ハッシュ
"a0e9f5d64349fb13191bc781f81f42e1"  ← JA3値

覚え方

暗号化トラフィック分析 = 消印・封筒・配達時間は見るけど、手紙は開けない宅配便の検査」と覚えましょう。中身を開けなくても、「深夜2時に海外の見知らぬ住所へ、毎日同じサイズの荷物を送り続けている」とわかれば十分怪しいですよね。


歴史と背景

  • 2013年頃 — Edward Snowdenによる暴露事件を機に、エンドツーエンド暗号化の採用が世界的に加速。企業トラフィックに占める暗号化通信の割合が急増し始める
  • 2015年 — Googleの統計で「Google向けトラフィックの過半数がHTTPS化」を達成。業界全体の暗号化促進の転換点に
  • 2016年 — JA3フィンガープリンティング手法がJohn Althouse・Jeff Atkinson・Josh Silbermanにより考案・公開(“JA3” は3人のイニシャル)
  • 2017年 — Ciscoが ETA(Encrypted Traffic Analytics)の概念を正式に提唱。機械学習を使った暗号化トラフィック分析をネットワーク機器に組み込む方針を発表
  • 2018年 — IETF が TLS 1.3 を標準化(RFC 8446)。Forward Secrecy が必須化され、中間者による復号が事実上不可能になり ETA の重要性がさらに高まる
  • 2019年以降NDR(Network Detection and Response)製品が ETA を標準機能として搭載。マイクロソフト・Palo Alto・Darktrace なども同様のアプローチを採用
  • 2022年以降QUIC(HTTP/3)の普及により、従来の TCP ベースの分析手法だけでは対応が困難になり、QUICトラフィック分析の研究が活発化

関連技術・アプローチの比較

暗号化通信を「どう扱うか」という観点で、主要なアプローチを比較します。

暗号化通信のセキュリティアプローチ比較 TLS復号検査 (SSL Inspection) ✅ 中身を完全に検査 ✅ 高精度な脅威検出 ❌ プライバシー問題 ❌ 復号の処理負荷大 ❌ 証明書ピンニング   が効かなくなる ❌ TLS 1.3の一部を   復号できない場合も 暗号化トラフィック分析 (ETA) ✅ 復号不要・低負荷 ✅ プライバシー保護 ✅ TLS 1.3でも機能 ✅ スケールしやすい ❌ 検出精度は復号検査   より若干劣る場合も ❌ 機械学習モデルの   継続的な更新が必要 ゼロトラスト / DNS (接続先制御) ✅ 悪意ある接続先を   DNS段階でブロック ✅ シンプルで軽量 ❌ 既知の脅威しか   防げない ❌ 未知のC2サーバーや   DGAには対応困難 ※ 実際の運用では複数アプローチを組み合わせて使うことが多い

ETAが特に有効なケース

  • マルウェアのC2(Command and Control)通信検出 — マルウェアが外部サーバーへ定期的に小さなパケットを送る「ビーコン通信」はタイミングのパターンで検出しやすい
  • データ窃取の検出 — 大量のデータが暗号化されて社外へ送出されると、転送量・時間帯・宛先の異常として検知できる
  • ランサムウェアの初期侵害検出 — ランサムウェアが使うTLSフィンガープリント(JA3値)が既知の場合、感染前に通信を遮断できる

関連する規格・RFC

規格・RFC番号内容
RFC 8446TLS 1.3 の標準仕様。Forward Secrecyが必須化されETAの重要性を高めた
RFC 8701TLS ClientHelloのグリース(GREASE)。JA3フィンガープリンティングへの影響に関連
RFC 9000QUIC(HTTP/3)の基本仕様。QUICトラフィックの分析はETAの新たな課題
RFC 8484DNS over HTTPS(DoH)。DNSクエリの暗号化がトラフィック分析の難易度を上げる

関連用語