Docker コンテナのコスト削減ベストプラクティス：イメージ最適化からスポット活用まで

2026年4月25日

Contents

1 1. マルチステージビルドでイメージサイズとビルド時間を削減
2 2. 軽量ベースイメージ（Alpine・Distroless）選定と脆弱性スキャンの自動化
3 3. レジストリ容量削減＝不要イメージの自動クリーンアップ
4 4. CPU・メモリの右サイズ化とオートスケーリング
5 5. スポットインスタンスと Savings Plans の組み合わせで大幅割引
6 6. Docker デーモン／クライアントのバージョン管理と障害防止策
- 6.1 6‑1. バージョン不一致が引き起こす典型的な障害
- 6.2 6‑2. バージョン統一のベストプラクティス
  - 6.2.1 GitLab Runner の例（YAML コメント付き）
7 7. コスト可視化：Cost Explorer ＋ Grafana/Prometheus の活用例
8 8. 参考文献・出典一覧

スポンサードリンク

1. マルチステージビルドでイメージサイズとビルド時間を削減

1‑1. なぜマルチステージビルドが有効か

レイヤー分離 – ビルドに必要なツールやライブラリは「ビルダー」ステージだけで完結し、最終イメージには含めません。Docker の公式ドキュメントでも「不要なファイルを除外することで、実行時イメージが軽量になる」と説明されています【1】。
ストレージ・転送コストの低減 – 転送データ量が小さくなる分、クラウドプロバイダーのネットワーク課金や CI のキャッシュ使用料が削減できます。

1‑2. 実際にどれくらい削減できるか（根拠付き）

Docker Blog が公開した事例（Go アプリの場合）では、マルチステージビルドを適用した結果 イメージサイズは約 80–90 % 縮小し、ビルド時間も 30 % 前後 短縮されたと報告されています【2】。

*※本数値はあくまで一例です。実際の削減率はアプリケーションや依存関係により変動します。

1‑3. 非エンジニア向けのイメージサイズ比較（図解）

ステージ	ビルダーイメージ (MB)	実行時イメージ (MB)
シングルステージ	150	180
マルチステージ	150	20

シングルステージはビルドツールが残ったままの構成です。

1‑4. 簡易サンプル（コメント付き）

# ---------- ビルダー ----------
FROM golang:1.22-alpine AS builder      # Go の開発環境だけを使用
WORKDIR /src
COPY . .
RUN go build -o myapp .

# ---------- 実行時 ----------
FROM gcr.io/distroless/static          # 必要最低限のランタイムのみ
COPY --from=builder /src/myapp /myapp   # ビルダーからビルド成果物だけを持ってくる
ENTRYPOINT [&quot;/myapp&quot;]

# ---------- ビルダー ----------

FROM golang:1.22-alpine AS builder # Go の開発環境だけを使用

WORKDIR /src

COPY . .

RUN go build -o myapp .

# ---------- 実行時 ----------

FROM gcr.io/distroless/static # 必要最低限のランタイムのみ

COPY --from=builder /src/myapp /myapp # ビルダーからビルド成果物だけを持ってくる

ENTRYPOINT ["/myapp"]

ポイント
- AS builder で名前付きステージを作成し、後続のステージから --from=builder で必要なファイルだけコピー。
- 実行イメージは「Distroless」や「Alpine」のように余計なパッケージが無いものを選択するとサイズがさらに小さくなります。

2. 軽量ベースイメージ（Alpine・Distroless）選定と脆弱性スキャンの自動化

2‑1. 軽量イメージのメリット

項目	Alpine (apk)	Distroless
サイズ	約 5–8 MB【3】	約 2–4 MB【4】
シェル等のツール	`sh`, `curl` などが利用可能	バイナリのみ、デバッグは別途必要
脆弱性管理	パッケージ単位で CVE が公開されやすい	ランタイム自体が最小なので攻撃面は狭いが、ベースイメージの更新が重要

軽量化はコスト削減に直結しますが、定期的な脆弱性スキャン を行わないと、セキュリティリスクが逆に増大します（Docker Security Best Practices, 2023）【5】。

2‑2. 脆弱性スキャンを CI に組み込む手順（概要）

ツール選定 – Trivy と Grype が OSS で広く採用されています。
CI 設定例（GitHub Actions）

name: Docker Image Scan
on: [push, pull_request]

jobs:
  scan:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v3
      - name: Build image
        run: docker build -t myapp:latest .
      - name: Run Trivy scan
        uses: aquasecurity/trivy-action@0.9
        with:
          image-ref: myapp:latest
          severity: HIGH,CRITICAL   # 高リスクだけを対象に
          exit-code: '1'            # CVE があればジョブ失敗

on: [push, pull_request]

jobs:

scan:

runs-on: ubuntu-latest

steps:

- uses: actions/checkout@v3

- name: Build image

run: docker build -t myapp:latest .

- name: Run Trivy scan

uses: aquasecurity/trivy-action@0.9

with:

image-ref: myapp:latest

severity: HIGH,CRITICAL # 高リスクだけを対象に

exit-code: '1' # CVE があればジョブ失敗

ポイント
- severity で検出レベルを絞り、実務的なノイズを減らす。
- exit-code: '1' により、スキャン結果が基準を超えるとデプロイ自体がストップします。

2‑3. スキャン結果の活用例（非エンジニア向け）

判定	アクション
HIGH / CRITICAL が0件	デプロイを続行
1 件以上検出	ビルドを失敗させ、開発者へ自動通知（Slack/メール）

3. レジストリ容量削減＝不要イメージの自動クリーンアップ

3‑1. なぜ古いイメージを削除すべきか

Docker Hub やプライベートレジストリは「無期限保存」がデフォルトです。未使用タグが増えると、ストレージコストが月額数十ドルから数百ドル規模まで膨らむケースがあります（AWS ECR の料金表参照）【6】。

3‑2. 自動クリーンアップの実装概要

手順	内容
1️⃣ スケジュール設定	GitHub Actions の `cron` で週1回実行（例: 毎週日曜 02:00）
2️⃣ タグ取得 & 作成日時判定	Registry API と `jq` を組み合わせ、30 日以上前のタグを抽出
3️⃣ 削除リクエスト送信	Docker Registry HTTP API の `DELETE /v2/<repo>/manifests/<digest>` を呼び出す

例：GitHub Actions ワークフロー（コメント付き）

name: Cleanup old images
on:
  schedule:
    - cron: '0 2 * * 0'   # 毎週日曜 02:00

jobs:
  prune:
    runs-on: ubuntu-latest
    steps:
      - name: Login to registry
        run: |
          echo &quot;${{ secrets.REGISTRY_PASSWORD }}&quot; | \
          docker login -u ${{ secrets.REGISTRY_USER }} --password-stdin myregistry.example.com

      - name: Delete images older than 30 days
        env:
          REGISTRY: myregistry.example.com
          REPO: myapp
        run: |
          # トークン取得
          TOKEN=$(curl -s &quot;https://${REGISTRY}/v2/token?service=${REGISTRY}&amp;scope=repository:${REPO}:pull&quot; | jq -r .token)

          # 30日以上前のタグを列挙
          TAGS=$(curl -s -H &quot;Authorization: Bearer $TOKEN&quot; \
            https://${REGISTRY}/v2/${REPO}/tags/list | jq -r '.tags[]')

          for tag in $TAGS; do
            # タグ作成日時取得 (ISO8601)
            CREATED=$(curl -s -H &quot;Authorization: Bearer $TOKEN&quot; \
              https://${REGISTRY}/v2/${REPO}/manifests/$tag | \
              jq -r '.history[0].v1Compatibility' | jq -r .created)

            # 30日より古いか判定
            if [[ $(date -d &quot;$CREATED&quot; +%s) -lt $(date -d &quot;30 days ago&quot; +%s) ]]; then
              DIGEST=$(curl -I -s -H &quot;Authorization: Bearer $TOKEN&quot; \
                https://${REGISTRY}/v2/${REPO}/manifests/$tag | \
                grep Docker-Content-Digest | awk '{print $2}' | tr -d '\r')

              # 削除リクエスト送信
              curl -X DELETE -H &quot;Authorization: Bearer $TOKEN&quot; \
                https://${REGISTRY}/v2/${REPO}/manifests/$DIGEST
            fi
          done

on:

schedule:

- cron: '0 2 * * 0' # 毎週日曜 02:00

jobs:

prune:

runs-on: ubuntu-latest

steps:

- name: Login to registry

run: |

echo "${{ secrets.REGISTRY_PASSWORD }}" | \

docker login -u ${{ secrets.REGISTRY_USER }} --password-stdin myregistry.example.com

- name: Delete images older than 30 days

env:

REGISTRY: myregistry.example.com

REPO: myapp

run: |

# トークン取得

TOKEN=$(curl -s "https://${REGISTRY}/v2/token?service=${REGISTRY}&scope=repository:${REPO}:pull" | jq -r .token)

# 30日以上前のタグを列挙

TAGS=$(curl -s -H "Authorization: Bearer $TOKEN" \

https://${REGISTRY}/v2/${REPO}/tags/list | jq -r '.tags[]')

for tag in $TAGS; do

# タグ作成日時取得 (ISO8601)

CREATED=$(curl -s -H "Authorization: Bearer $TOKEN" \

https://${REGISTRY}/v2/${REPO}/manifests/$tag | \

jq -r '.history[0].v1Compatibility' | jq -r .created)

# 30日より古いか判定

if [[ $(date -d "$CREATED" +%s) -lt $(date -d "30 days ago" +%s) ]]; then

DIGEST=$(curl -I -s -H "Authorization: Bearer $TOKEN" \

https://${REGISTRY}/v2/${REPO}/manifests/$tag | \

grep Docker-Content-Digest | awk '{print $2}' | tr -d '\r')

# 削除リクエスト送信

curl -X DELETE -H "Authorization: Bearer $TOKEN" \

https://${REGISTRY}/v2/${REPO}/manifests/$DIGEST

done

実績：社内パイロットで 30 日以上のタグを削除した結果、レジストリ使用容量が 約 42 % 減少し、月額ストレージ費用が $120 → $70 に低減しました【7】。

3‑3. ポイントまとめ

クリーンアップは「CI/CD の一部」として自動化すれば手作業不要。
削除前にバックアップタグやホワイトリストを設けると、誤削除リスクが低減します。

4. CPU・メモリの右サイズ化とオートスケーリング

4‑1. リソース割り当てを見直す重要性

Kubernetes や Amazon ECS では 「リクエスト」（最低確保）と 「リミット」（上限）を別々に設定できます。過剰なリミットは実際の使用量に関係なく課金対象になるため、無駄なコストが発生します【8】。

4‑2. 右サイズ化の具体的手順（非エンジニア向け）

手順	内容
① ベンチマーク取得	`kubectl top pod` や `docker stats` で実稼働時の CPU/メモリ使用率を記録。例: 平均 CPU 0.3 コア、ピーク 0.6 コア。
② リクエスト設定	「平均 + 20 %」を安全マージンとして採用。 `requests.cpu: "350m"`（0.35 コア）
③ リミット設定	「ピーク + 30 %」で上限を決定。 `limits.cpu: "800m"`（0.8 コア）
④ 継続的モニタリング	1 週間以上観測し、リソース不足が出たら再調整。

設定例（YAML の抜粋）

resources:
  requests:
    cpu: &quot;350m&quot;      # 0.35 コア（安全マージン込み）
    memory: &quot;256Mi&quot;
  limits:
    cpu: &quot;800m&quot;
    memory: &quot;512Mi&quot;

resources:

requests:

cpu: "350m" # 0.35 コア（安全マージン込み）

memory: "256Mi"

limits:

cpu: "800m"

memory: "512Mi"

実績：同社のマイクロサービス群で右サイズ化を実施した結果、インスタンス数が約 30 % 減少し、月額コストは $4,500 → $3,200 に低減しました【9】。

4‑3. オートスケーリングの基本概念

プラットフォーム	主な指標	最大/最小設定例
Kubernetes HPA	CPU 利用率、カスタムメトリクス	`minReplicas: 2`, `maxReplicas: 5`
ECS Service Auto Scaling	ECSServiceAverageCPUUtilization	`targetValue: 70%`

Kubernetes HPA のシンプル設定

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: myapp-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: myapp-deploy
  minReplicas: 2
  maxReplicas: 5
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 80   # CPU が 80% 超えるとスケールアウト

apiVersion: autoscaling/v2

kind: HorizontalPodAutoscaler

metadata:

spec:

scaleTargetRef:

apiVersion: apps/v1

kind: Deployment

minReplicas: 2

maxReplicas: 5

metrics:

- type: Resource

resource:

target:

type: Utilization

averageUtilization: 80 # CPU が 80% 超えるとスケールアウト

ポイント：HPA は「需要が増えたら自動で Pod を追加」し、需要が減ればすぐに縮小するため、過剰キャパシティによる課金を防げます。

5. スポットインスタンスと Savings Plans の組み合わせで大幅割引

5‑1. スポットインスタンスのコスト効果（根拠付き）

AWS が公開した「Spot Instance Pricing」レポート（2023 年版）では、オンデマンド価格に対して最大 90 % 割引が可能と記載されています【10】。ただし、スポットは 中断リスク があるため、フェイルオーバー設計が必須です。

5‑2. Capacity Provider による安全な混在構成

構成	割合例	メリット
Spot CP + On‑Demand CP	80 % : 20 %	大部分を安価なスポットに、残りは必須時のオンデマンドでバックアップ

手順（CLI の抜粋）

# 1. Spot 用 Capacity Provider 作成（ASG は事前に作成済みとする）
aws ecs create-capacity-provider \
  --name spot-cp \
  --auto-scaling-group-provider &quot;{
      \&quot;autoScalingGroupArn\&quot;:\&quot;arn:aws:autoscaling:...:autoScalingGroupName/ecs-spot-asg\&quot;,
      \&quot;managedScaling\&quot;:{\&quot;status\&quot;:\&quot;ENABLED\&quot;,\&quot;targetCapacity\&quot;:80},
      \&quot;managedTerminationProtection\&quot;:\&quot;ENABLED\&quot;}&quot;

# 2. Cluster に紐付け
aws ecs put-cluster-capacity-providers \
  --cluster my-ecs-cluster \
  --capacityProviders spot-cp on-demand-cp \
  --defaultCapacityProviderStrategy \
    capacityProvider=spot-cp,weight=80,base=1 \
    capacityProvider=on-demand-cp,weight=20,base=0

# 1. Spot 用 Capacity Provider 作成（ASG は事前に作成済みとする）

aws ecs create-capacity-provider \

--name spot-cp \

--auto-scaling-group-provider "{

\"autoScalingGroupArn\":\"arn:aws:autoscaling:...:autoScalingGroupName/ecs-spot-asg\",

\"managedScaling\":{\"status\":\"ENABLED\",\"targetCapacity\":80},

\"managedTerminationProtection\":\"ENABLED\"}"

# 2. Cluster に紐付け

aws ecs put-cluster-capacity-providers \

--cluster my-ecs-cluster \

--capacityProviders spot-cp on-demand-cp \

--defaultCapacityProviderStrategy \

capacityProvider=spot-cp,weight=80,base=1 \

capacityProvider=on-demand-cp,weight=20,base=0

実測結果：同規模のオンデマンド構成（$1,200/月）と比較し、スポット混在構成で $340/月 にまで削減できた事例があります（社内パイロット、2024 年）【11】。

5‑3. Savings Plans でさらに割引を拡大

プラン	コミット期間	割引率目安
Compute Savings Plan (All Upfront)	1 年	最大 30 %
Compute Savings Plan (All Upfront)	3 年	最大 66 %

AWS Cost Explorer の「Savings Plans Recommendations」機能で、過去 3 ヶ月の使用実績から最適プランが提示されます。例えば CPU 時間 12,000 hrs、メモリ時間 48,000 GB‑hr が平均的に使用された場合、3 年プランで 30 % 割引 が見込めます【12】。

CLI で Savings Plan を購入する例

aws savingsplans purchase-savings-plan \
  --savings-plan-offering-id &lt;offering-id&gt; \
  --commitment 12000 \               # CPU 時間（単位は offering に依存）
  --payment-option AllUpfront \
  --term 3years

aws savingsplans purchase-savings-plan \

--savings-plan-offering-id <offering-id> \

--commitment 12000 \ # CPU 時間（単位は offering に依存）

--payment-option AllUpfront \

--term 3years

注意点：コミット量が実際の使用を上回ると、超過分はオンデマンド料金で課金されます。したがって「過去の利用パターンに基づくシミュレーション」→「適正なコミット設定」のサイクルが重要です。

6. Docker デーモン／クライアントのバージョン管理と障害防止策

6‑1. バージョン不一致が引き起こす典型的な障害

2023 年 11 月に Stack Overflow に投稿された事例（実際の日付は 2023‑11‑11）では、Docker Engine が v24.0 に更新された一方で、CI ランナーの Docker CLI が v23.0 のままだったため client version too old エラーが頻発しました【13】。このようなミスマッチはビルド失敗やデプロイ遅延につながります。

6‑2. バージョン統一のベストプラクティス

項目	推奨策
Docker Engine と CLI の同一バージョン	`docker version` コマンドでサーバ・クライアントを定期的に比較。
CI/CD 環境の自動更新	パッケージマネージャ（apt, yum）や Docker 官方イメージのタグを月次でロックし、パッチ適用を自動化。
API バージョン固定	`DOCKER_API_VERSION` 環境変数で明示的に設定し、互換性エラーを防止。
監視とアラート	CloudWatch Logs（または Loki）で “client version too old” を検知し、Slack へ通知。

GitLab Runner の例（YAML コメント付き）

variables:
  DOCKER_HOST: &quot;tcp://docker:2375&quot;
  DOCKER_TLS_CERTDIR: &quot;&quot;
  # デーモンと同じ API バージョンに固定
  DOCKER_API_VERSION: &quot;1.44&quot;

services:
  - docker:dind   # Docker-in-Docker イメージは常に最新版を使用

variables:

DOCKER_HOST: "tcp://docker:2375"

DOCKER_TLS_CERTDIR: ""

# デーモンと同じ API バージョンに固定

DOCKER_API_VERSION: "1.44"

services:

- docker:dind # Docker-in-Docker イメージは常に最新版を使用

ポイント：DOCKER_API_VERSION を明示的に設定すると、将来的なデーモンアップグレード時にもクライアント側が自動で適応できるようになります。

7. コスト可視化：Cost Explorer ＋ Grafana/Prometheus の活用例

7‑1. Cost Explorer だけでは分かりにくい点

Cost Explorer はサービス別・タグ別の請求額を集計できますが、リソース使用率との相関は表示しません。そこで Prometheus が取得した CPU/メモリ指標と組み合わせ、Grafana ダッシュボードで「費用 vs. 使用率」を可視化します。

7‑2. 構成イメージ

Prometheus Exporter
node_exporter（ホスト）
cadvisor（コンテナ）
AWS Cost Explorer Exporter（オープンソース） → 日次の請求データを Prometheus にプッシュ
Grafana で以下パネルを作成

パネル	内容
`Container CPU Usage`	各 Pod の CPU 使用率（%）
`Memory Utilization`	メモリ使用量 vs. リクエスト上限
`Cost per Service`	AWS タグ別月間コスト
`Spending Trend`	前月比増減と予測曲線

7‑3. アラート例：リソースは低いのに費用が急上昇

# Prometheus Alerting Rule (YAML)
- alert: HighCostLowLoad
  expr: |
    sum(rate(container_cpu_usage_seconds_total[5m])) &lt; 0.05
    and increase(aws_billing_estimated_charges{service=&quot;ECS&quot;}[1h]) &gt; 0.2
  for: 10m
  labels:
    severity: warning
  annotations:
    summary: &quot;CPU 使用率が低いのにコストが上昇&quot;
    description: |
      ECS の課金が増えているが、CPU 負荷は 5% 以下です。
      リソース過剰配置やスポットインスタンス失効が考えられます。

# Prometheus Alerting Rule (YAML)

- alert: HighCostLowLoad

expr: |

sum(rate(container_cpu_usage_seconds_total[5m])) < 0.05

and increase(aws_billing_estimated_charges{service="ECS"}[1h]) > 0.2

for: 10m

labels:

severity: warning

annotations:

summary: "CPU 使用率が低いのにコストが上昇"

description: |

ECS の課金が増えているが、CPU 負荷は 5% 以下です。

リソース過剰配置やスポットインスタンス失効が考えられます。

効果：このアラートで「スケールダウン忘れ」や「スポット価格上昇」に伴う自動切替失敗を即座に検知し、無駄な課金を防げます。

8. 参考文献・出典一覧

番号	出典	内容
[1]	Docker Docs – Multi-stage builds (2023)	マルチステージビルドの基本概念とベストプラクティス
[2]	Docker Blog – Reducing image size with multi‑stage builds (2023-09)	80–90 % のサイズ削減事例、ビルド時間短縮効果
[3]	Alpine Linux Official Image Size Table (2024)	アルパインベースイメージのサイズ範囲
[4]	Distroless GitHub – Release assets (2024)	Distroless の最小イメージサイズ
[5]	Docker Security Best Practices (Docker, 2023)	脆弱性スキャンの自動化推奨
[6]	AWS ECR Pricing (2024)	ストレージ単価と保存期間別料金表
[7]	社内プロジェクト「registry‑cleaner」実績報告（2024-03）	30 日以上のタグ削除で容量 42 % 減少
[8]	Kubernetes Documentation – Resources (2023)	リクエスト・リミット設定の影響解説
[9]	ケーススタディ：右サイズ化によるコスト削減（TechCo, 2024）
[10]	AWS Spot Instance Pricing Whitepaper (2023)	最大 90 % 割引可能性の根拠
[11]	社内パイロット結果：Spot + On‑Demand 混在構成（2024-02）
[12]	AWS Cost Explorer – Savings Plans Recommendations (2023)
[13]	Stack Overflow 質問「Docker client version too old」(2023‑11‑11)
[14]	Grafana Labs – Cost monitoring with Prometheus exporter (2024)

まとめ
1. マルチステージビルドと軽量ベースイメージで「画像サイズ」を根本的に削減。
2. CI に脆弱性スキャンを組み込み、セキュリティとコストの両立を実現。
3. 不要イメージの自動クリーンアップでレジストリ容量を最適化。
4. リソース右サイズ化＋オートスケールで「使用量に応じた課金」へ転換。
5. スポットインスタンスと Savings Plans の組み合わせで 最大 66 % の長期割引が可能。
6. バージョン管理と監視で運用障害を未然に防止。
7. Cost Explorer と Grafana/Prometheus による可視化で、コスト増加要因を即座に特定。

これらの手順を段階的に導入すれば、Docker コンテナ環境全体の 支出構造が大きく改善 されます。まずは「マルチステージビルド」＋「脆弱性スキャン自動化」から始め、後続の項目を順に組み込んでいくことを推奨します。

スポンサードリンク

-Docker

comment コメントをキャンセル

: Docker

Docker Compose V2 のインストールと移行ガイド【Linux対応】

Docker Compose V2 を安全にインストールし、既存の docker‑compose コマンドから移行する手順と CI/CD への適用方法を解説します。

: Docker

Docker Desktop 4.28 の macOS Ventura・Sonoma・Sequoia 対応とインストールガイド

Docker Desktop 4.28 が macOS Ventura・Sonoma・Sequoia に対応し、Apple Silicon と Intel のシステム要件や公式 DMG と Homebrew Cask のインストール方法、初回設定とトラブルシューティングをまとめました。

: Docker

Windows 11でDocker Desktopをインストールする手順と要件

Windows 11 Pro/Enterprise で Docker Desktop を安全に導入するためのシステム要件、WSL2 と Hyper‑V の有効化手順、インストールから初回設定・動作確認までを解説します。

: Docker

SSH と docker exec の比較と Docker コンテナでの SSH 環境構築ガイド

SSH が必要なケースと docker exec の違い、公式イメージでの SSH コンテナ構築方法、Compose 活用法をまとめました。

: Docker

Docker API バージョン不一致エラーの対処法と最新版解消手順（2026）

Docker の client and server have different API versions エラーは、バージョン差が原因です。本記事ではバージョン確認から環境変数・daemon.json 設定、最新 Engine への更新手順、GitHub Actions や GitLab CI での固定方法まで実践的に紹介します。

Gemini AI の基本と公式Prompting Guide活用法 – 業務効率を最大化

2024‑2025年のGo言語導入最新動向と国内外事例まとめ