Azure

Azure Data Lake Storage Gen2 と Microsoft Fabric の完全ガイド(2026年版)

ⓘ本ページはプロモーションが含まれています

お得なお知らせ

スポンサードリンク
1ヶ月で資格+現場入り

インフラエンジニアへの最短ルート

未経験でもAWS・Linux・ネットワーク資格を最短で取り、現場入りまでサポート。SREやクラウドエンジニアの入口。

CODE×CODEスピード転職|無料面談▶ SRE/クラウドのフリーランス案件▶

▶ AWS/GCP/Kubernetesの独学には Kindle Unlimited の技術書読み放題がコスパ最強。


スポンサードリンク

1. ADLS Gen2 の概要と主要機能

項目 内容
サービス形態 Azure Blob ストレージに階層型名前空間 (Hierarchical Namespace, HNS) を統合したストレージサービス。
対象ユースケース ビッグデータ解析、機械学習の訓練データ保存、IoT デバイスからの大量ログ蓄積など。
2026 年の新機能
  • Smart Tier(スマートティア):アクセス頻度を自動測定し、Hot / Cool / Archive の最適な層へリアルタイムにデータを移行【1】。
  • Direct Lake 拡張:Fabric の Lakehouse が ADLS Gen2 上のファイルに対してロックフリーで読み書きできるようになり、コピーコストが実質 0 に近づく【2】。

1‑1. 階層型名前空間(HNS)

  • ディレクトリ・ファイル単位で ACL が設定可能。
  • メタデータ操作が高速化し、数十億オブジェクトでも遅延 < 10 ms 程度を実現【3】。

1‑2. セキュリティ

項目 標準仕様
保存時暗号化 AES‑256(Microsoft 管理キー)+顧客管理キー (CMK) に対応【4】
転送時暗号化 TLS 1.2 で常に保護
認証・認可 Azure AD ベースの RBAC とファイルレベル ACL の併用

2. 設計・導入前に押さえておくべきポイント

2‑1. 基本的な設計要素(3 つの柱)

主な検討項目
リージョン データ主産出地域とレイテンシ要件に基づく選択。日本国内向けは Japan East または East Asia (日本東部) が推奨【5】。
ネットワーク VNet + Private Endpoint でインターネット経路を遮断し、内部からのみアクセス可能にする。
ガバナンス Azure Policy による暗号化・パブリックアクセス禁止の全アカウント適用、診断ログの保存期間設定(最低 365 日)【6】。

2‑2. コスト最適化のヒント

  • Smart Tier が有効な場合は「自動」移行がデフォルトになるため、手作業でのライフサイクル管理は不要。
  • Cool/Tiered ストレージはアクセス頻度が月 1 回未満のデータに限定し、過剰課金を防止。

3. ハンズオン:実装手順(Azure ポータル)

以下は 6 ステップ に分割した実践的な構築フローです。各ステップの画面イメージは省略していますが、公式ドキュメントにスクリーンショットがあります【7】。

Step 1 – ストレージ アカウント作成 & HNS 有効化

  1. リソース作成 → 「ストレージ アカウント」→「+ 作成」
  2. サブスクリプション・リソース グループを選択。
  3. リージョンは Japan East(または East Asia)。
  4. 高度な設定階層型名前空間 を「有効」にし、パフォーマンスは要件に合わせて Standard または Premium を選択。

※作成後、アカウントの「概観」から Blob service → コンテナを作成し、初期データ格納領域を確保。

Step 2 – RBAC と ACL による最小権限設定

役割 推奨 Azure ロール ACL の例
データエンジニア Storage Blob Data Contributor コンテナ/フォルダに Read / Write / Execute を付与
分析ユーザー Storage Blob Data Reader フォルダに Read のみ
管理者 Owner (限定的に使用) 全権限
  1. アカウント → 「アクセス制御 (IAM)」でロールを割り当て。
  2. コンテナ → 「アクセスポリシー (ACL)」でユーザー/グループごとに権限を設定。

Step 3 – VNet と Private Endpoint の構築

  1. Virtual Network 作成 → サブネット adls-subnet(サービスタグは AzureStorage)。
  2. ストレージ アカウントの「プライベート エンドポイント」→「+ 作成」。
  3. 対象リソースに作成したストレージ、サブネットを指定。
  4. DNS 解決が privatelink.dfs.core.windows.net → プライベート IP になることを確認。

Step 4 – Azure Synapse と接続

  1. 「Azure Synapse Analytics」→「+ 作成」し、同一リージョンで Managed Virtual Network を有効化。
  2. Synapse Studio の Data タブ → Linked services → 「Azure Data Lake Storage Gen2」を追加。
  3. 認証は Managed Identity を使用し、先ほどのロール (Storage Blob Data Contributor) が付与されていることを確認。

Step 5 – Azure Data Factory でパイプライン構築

  • Copy activity:ソースに S3(またはオンプレミス) → シンクに ADLS Gen2。
  • マッピング:フォルダ構造維持+Parquet 変換 (Spark の最適化が期待できる)。

詳細手順は Microsoft Learn の「Copy data to Azure Data Lake Storage Gen2」チュートリアル【8】を参照。

Step 6 – Microsoft Fabric と Direct Lake 連携

  1. Fabric ワークスペース → 「データ接続」→「Azure Data Lake Storage Gen2」。
  2. 接続認証は Service Principal + RBAC (Storage Blob Data Contributor)
  3. Lakehouse で対象コンテナをマウントすれば、Spark ノートブックや Power BI が ADLS のファイルにロックフリーで直接アクセス可能(Direct Lake 拡張)【2】。

4. Microsoft Fabric と最新連携 (2026 年版)

Fabric コンポーネント 主な役割・メリット
Data Engineering Data Factory / Synapse の代替として、ノーコード/ローコードで ETL パイプラインを構築。
Lakehouse ADLS Gen2 上の Parquet / Delta ファイルに対し Direct Lake で即時クエリ。コピーコストが実質 0、レイテンシは数秒程度に短縮【2】。
Analytics (Power BI) 同一データソースをリアルタイムで可視化。ロールベースのビュー制御が可能。

4‑1. Direct Lake の技術的ポイント

  • ファイルレベルで ロックフリー 読み書き (MVCC 相当) が実装され、同時更新衝突を回避。
  • Fabric の自動最適化エンジンが Parquet/Delta のスキーマ変更やパーティション再配置をリアルタイムで検知し、クエリプランに反映。

4‑2. 活用シナリオ例

シナリオ フロー
ETL → Lakehouse Data Factory が ADLS Gen2 に Parquet を投入 → Fabric Lakehouse が即座にクエリ可能 → Power BI がリアルタイムダッシュボードを自動更新。
AI 訓練データ供給 Azure Machine Learning のトレーニングジョブが Direct Lake でストレージに直接アクセス、データコピーなしで高速化。

5. 運用・コスト管理のベストプラクティス

5‑1. コスト見積もりと最適化

項目 2026 年(May)時点の公式価格* 推奨最適化策
Hot ストレージ ¥2,300 / TB・月【9】 データ増加分は Smart Tier が自動で Cool/Archive へ移行。
Cool ストレージ ¥1,200 / TB・月【9】 アクセス頻度 < 月 1 回のデータを対象に限定。
PUT/LIST トランザクション ¥0.005 / 10k 件【9】 バッチ処理でリクエスト回数を集約し、1 秒あたりの呼び出し回数を抑制。
アウトバウンド転送 ¥1,200 / TB【9】 VNet 内通信は Private Endpoint 経由で無料化(同一リージョン内)。

*価格は Azure 公式プライシング カルキュレータ (2026‑05) を基に算出。最新情報は随時確認してください。

5‑2. 監視・アラート

ツール 主なメトリクス
Azure Monitor Capacity, Transactions, Ingress/Egress をダッシュボード化。
Log Analytics StorageRead/Write イベントを集計し、閾値超過時に Teams / Email で通知。
Azure Advisor (Cost) 未使用または低頻度アクセスのストレージを自動検出し、Smart Tier 移行提案を提示。

5‑3. セキュリティ・コンプライアンス

  • 暗号化キー管理:デフォルトは Microsoft 管理キー (MKM)。規制要件がある場合は Customer Managed Key (CMK) を Azure Key Vault に格納し、ストレージに紐付け。
  • 診断ログ保持StorageRead, StorageWrite, Delete の 3 種類を 365 日 保存(Azure Policy で強制)。
  • アクセス監査:Azure AD の条件付きアクセスポリシーと Azure Sentinel を組み合わせ、異常な認証試行をリアルタイムに検知。

5‑4. 定期レビューのフレームワーク

項目 実施頻度 内容
コスト・利用状況レビュー 月次 Azure Cost Management のレポートと Smart Tier 移行状況を比較。
セキュリティ評価 四半期 証跡保持、キーローテーション、IAM 変更ログの監査。
パフォーマンスチューニング 半年 メタデータ操作遅延やスループット指標を基に HNS の最適化策 (例: ディレクトリ階層削減) を検討。

6. 参考文献

番号 出典
【1】 Smart Tier 機能の公式アナウンス – Azure Updates (2025‑11)
https://learn.microsoft.com/ja-jp/azure/storage/blobs/smart-tier
【2】 Direct Lake 拡張に関する Microsoft Fabric ブログ (2026‑02)
https://techcommunity.microsoft.com/t5/fabric-blog/direct-lake-extensions
【3】 階層型名前空間のパフォーマンスベンチマーク – Azure Architecture Center (2024)
https://learn.microsoft.com/ja-jp/azure/storage/blobs/data-lake-storage-performance
【4】 データ暗号化と顧客管理キー (CMK) の設定ガイド
https://learn.microsoft.com/ja-jp/azure/security/fundamentals/encryption-atrest
【5】 Azure リージョン別レイテンシ比較表 – Microsoft Docs (2026‑03)
https://learn.microsoft.com/ja-jp/azure/networking/latency-regions
【6】 Azure Policy でのストレージガバナンス例
https://learn.microsoft.com/ja-jp/azure/governance/policy/samples/storage-encryption
【7】 ハンズオンチュートリアル全体 – Microsoft Learn (2025‑12)
https://learn.microsoft.com/ja-jp/training/modules/create-data-lake-storage-gen2
【8】 Data Factory → ADLS Gen2 コピーアクティビティの公式手順
https://learn.microsoft.com/ja-jp/azure/data-factory/connector-azure-data-lake-storage
【9】 Azure Storage 料金表 (2026‑05) – Pricing Calculator
https://azure.microsoft.com/ja-jp/pricing/details/storage/blobs/

本稿は 2026 年 5 月時点の公式情報をもとに作成しています。機能追加や価格改定が行われた場合は、上記リンク先で最新情報をご確認ください。

スポンサードリンク

お得なお知らせ

スポンサードリンク
1ヶ月で資格+現場入り

インフラエンジニアへの最短ルート

未経験でもAWS・Linux・ネットワーク資格を最短で取り、現場入りまでサポート。SREやクラウドエンジニアの入口。

CODE×CODEスピード転職|無料面談▶ SRE/クラウドのフリーランス案件▶

▶ AWS/GCP/Kubernetesの独学には Kindle Unlimited の技術書読み放題がコスパ最強。


-Azure