Contents
1. ADLS Gen2 の概要と主要機能
| 項目 | 内容 |
|---|---|
| サービス形態 | Azure Blob ストレージに階層型名前空間 (Hierarchical Namespace, HNS) を統合したストレージサービス。 |
| 対象ユースケース | ビッグデータ解析、機械学習の訓練データ保存、IoT デバイスからの大量ログ蓄積など。 |
| 2026 年の新機能 |
|
1‑1. 階層型名前空間(HNS)
- ディレクトリ・ファイル単位で ACL が設定可能。
- メタデータ操作が高速化し、数十億オブジェクトでも遅延 < 10 ms 程度を実現【3】。
1‑2. セキュリティ
| 項目 | 標準仕様 |
|---|---|
| 保存時暗号化 | AES‑256(Microsoft 管理キー)+顧客管理キー (CMK) に対応【4】 |
| 転送時暗号化 | TLS 1.2 で常に保護 |
| 認証・認可 | Azure AD ベースの RBAC とファイルレベル ACL の併用 |
2. 設計・導入前に押さえておくべきポイント
2‑1. 基本的な設計要素(3 つの柱)
| 柱 | 主な検討項目 |
|---|---|
| リージョン | データ主産出地域とレイテンシ要件に基づく選択。日本国内向けは Japan East または East Asia (日本東部) が推奨【5】。 |
| ネットワーク | VNet + Private Endpoint でインターネット経路を遮断し、内部からのみアクセス可能にする。 |
| ガバナンス | Azure Policy による暗号化・パブリックアクセス禁止の全アカウント適用、診断ログの保存期間設定(最低 365 日)【6】。 |
2‑2. コスト最適化のヒント
- Smart Tier が有効な場合は「自動」移行がデフォルトになるため、手作業でのライフサイクル管理は不要。
- Cool/Tiered ストレージはアクセス頻度が月 1 回未満のデータに限定し、過剰課金を防止。
3. ハンズオン:実装手順(Azure ポータル)
以下は 6 ステップ に分割した実践的な構築フローです。各ステップの画面イメージは省略していますが、公式ドキュメントにスクリーンショットがあります【7】。
Step 1 – ストレージ アカウント作成 & HNS 有効化
- リソース作成 → 「ストレージ アカウント」→「+ 作成」
- サブスクリプション・リソース グループを選択。
- リージョンは Japan East(または East Asia)。
- 高度な設定 で 階層型名前空間 を「有効」にし、パフォーマンスは要件に合わせて Standard または Premium を選択。
※作成後、アカウントの「概観」から Blob service → コンテナを作成し、初期データ格納領域を確保。
Step 2 – RBAC と ACL による最小権限設定
| 役割 | 推奨 Azure ロール | ACL の例 |
|---|---|---|
| データエンジニア | Storage Blob Data Contributor | コンテナ/フォルダに Read / Write / Execute を付与 |
| 分析ユーザー | Storage Blob Data Reader | フォルダに Read のみ |
| 管理者 | Owner (限定的に使用) | 全権限 |
- アカウント → 「アクセス制御 (IAM)」でロールを割り当て。
- コンテナ → 「アクセスポリシー (ACL)」でユーザー/グループごとに権限を設定。
Step 3 – VNet と Private Endpoint の構築
- Virtual Network 作成 → サブネット
adls-subnet(サービスタグは AzureStorage)。 - ストレージ アカウントの「プライベート エンドポイント」→「+ 作成」。
- 対象リソースに作成したストレージ、サブネットを指定。
- DNS 解決が
privatelink.dfs.core.windows.net→ プライベート IP になることを確認。
Step 4 – Azure Synapse と接続
- 「Azure Synapse Analytics」→「+ 作成」し、同一リージョンで Managed Virtual Network を有効化。
- Synapse Studio の Data タブ → Linked services → 「Azure Data Lake Storage Gen2」を追加。
- 認証は Managed Identity を使用し、先ほどのロール (
Storage Blob Data Contributor) が付与されていることを確認。
Step 5 – Azure Data Factory でパイプライン構築
- Copy activity:ソースに S3(またはオンプレミス) → シンクに ADLS Gen2。
- マッピング:フォルダ構造維持+Parquet 変換 (Spark の最適化が期待できる)。
詳細手順は Microsoft Learn の「Copy data to Azure Data Lake Storage Gen2」チュートリアル【8】を参照。
Step 6 – Microsoft Fabric と Direct Lake 連携
- Fabric ワークスペース → 「データ接続」→「Azure Data Lake Storage Gen2」。
- 接続認証は Service Principal + RBAC (Storage Blob Data Contributor)。
- Lakehouse で対象コンテナをマウントすれば、Spark ノートブックや Power BI が ADLS のファイルにロックフリーで直接アクセス可能(Direct Lake 拡張)【2】。
4. Microsoft Fabric と最新連携 (2026 年版)
| Fabric コンポーネント | 主な役割・メリット |
|---|---|
| Data Engineering | Data Factory / Synapse の代替として、ノーコード/ローコードで ETL パイプラインを構築。 |
| Lakehouse | ADLS Gen2 上の Parquet / Delta ファイルに対し Direct Lake で即時クエリ。コピーコストが実質 0、レイテンシは数秒程度に短縮【2】。 |
| Analytics (Power BI) | 同一データソースをリアルタイムで可視化。ロールベースのビュー制御が可能。 |
4‑1. Direct Lake の技術的ポイント
- ファイルレベルで ロックフリー 読み書き (MVCC 相当) が実装され、同時更新衝突を回避。
- Fabric の自動最適化エンジンが Parquet/Delta のスキーマ変更やパーティション再配置をリアルタイムで検知し、クエリプランに反映。
4‑2. 活用シナリオ例
| シナリオ | フロー |
|---|---|
| ETL → Lakehouse | Data Factory が ADLS Gen2 に Parquet を投入 → Fabric Lakehouse が即座にクエリ可能 → Power BI がリアルタイムダッシュボードを自動更新。 |
| AI 訓練データ供給 | Azure Machine Learning のトレーニングジョブが Direct Lake でストレージに直接アクセス、データコピーなしで高速化。 |
5. 運用・コスト管理のベストプラクティス
5‑1. コスト見積もりと最適化
| 項目 | 2026 年(May)時点の公式価格* | 推奨最適化策 |
|---|---|---|
| Hot ストレージ | ¥2,300 / TB・月【9】 | データ増加分は Smart Tier が自動で Cool/Archive へ移行。 |
| Cool ストレージ | ¥1,200 / TB・月【9】 | アクセス頻度 < 月 1 回のデータを対象に限定。 |
| PUT/LIST トランザクション | ¥0.005 / 10k 件【9】 | バッチ処理でリクエスト回数を集約し、1 秒あたりの呼び出し回数を抑制。 |
| アウトバウンド転送 | ¥1,200 / TB【9】 | VNet 内通信は Private Endpoint 経由で無料化(同一リージョン内)。 |
*価格は Azure 公式プライシング カルキュレータ (2026‑05) を基に算出。最新情報は随時確認してください。
5‑2. 監視・アラート
| ツール | 主なメトリクス |
|---|---|
| Azure Monitor | Capacity, Transactions, Ingress/Egress をダッシュボード化。 |
| Log Analytics | StorageRead/Write イベントを集計し、閾値超過時に Teams / Email で通知。 |
| Azure Advisor (Cost) | 未使用または低頻度アクセスのストレージを自動検出し、Smart Tier 移行提案を提示。 |
5‑3. セキュリティ・コンプライアンス
- 暗号化キー管理:デフォルトは Microsoft 管理キー (MKM)。規制要件がある場合は Customer Managed Key (CMK) を Azure Key Vault に格納し、ストレージに紐付け。
- 診断ログ保持:
StorageRead,StorageWrite,Deleteの 3 種類を 365 日 保存(Azure Policy で強制)。 - アクセス監査:Azure AD の条件付きアクセスポリシーと Azure Sentinel を組み合わせ、異常な認証試行をリアルタイムに検知。
5‑4. 定期レビューのフレームワーク
| 項目 | 実施頻度 | 内容 |
|---|---|---|
| コスト・利用状況レビュー | 月次 | Azure Cost Management のレポートと Smart Tier 移行状況を比較。 |
| セキュリティ評価 | 四半期 | 証跡保持、キーローテーション、IAM 変更ログの監査。 |
| パフォーマンスチューニング | 半年 | メタデータ操作遅延やスループット指標を基に HNS の最適化策 (例: ディレクトリ階層削減) を検討。 |
6. 参考文献
| 番号 | 出典 |
|---|---|
| 【1】 | Smart Tier 機能の公式アナウンス – Azure Updates (2025‑11) https://learn.microsoft.com/ja-jp/azure/storage/blobs/smart-tier |
| 【2】 | Direct Lake 拡張に関する Microsoft Fabric ブログ (2026‑02) https://techcommunity.microsoft.com/t5/fabric-blog/direct-lake-extensions |
| 【3】 | 階層型名前空間のパフォーマンスベンチマーク – Azure Architecture Center (2024) https://learn.microsoft.com/ja-jp/azure/storage/blobs/data-lake-storage-performance |
| 【4】 | データ暗号化と顧客管理キー (CMK) の設定ガイド https://learn.microsoft.com/ja-jp/azure/security/fundamentals/encryption-atrest |
| 【5】 | Azure リージョン別レイテンシ比較表 – Microsoft Docs (2026‑03) https://learn.microsoft.com/ja-jp/azure/networking/latency-regions |
| 【6】 | Azure Policy でのストレージガバナンス例 https://learn.microsoft.com/ja-jp/azure/governance/policy/samples/storage-encryption |
| 【7】 | ハンズオンチュートリアル全体 – Microsoft Learn (2025‑12) https://learn.microsoft.com/ja-jp/training/modules/create-data-lake-storage-gen2 |
| 【8】 | Data Factory → ADLS Gen2 コピーアクティビティの公式手順 https://learn.microsoft.com/ja-jp/azure/data-factory/connector-azure-data-lake-storage |
| 【9】 | Azure Storage 料金表 (2026‑05) – Pricing Calculator https://azure.microsoft.com/ja-jp/pricing/details/storage/blobs/ |
本稿は 2026 年 5 月時点の公式情報をもとに作成しています。機能追加や価格改定が行われた場合は、上記リンク先で最新情報をご確認ください。