Contents
Google Cloud アカウント作成と無料トライアル登録(2026 年版)
Google Cloud の全サービスを利用するには、まず GCP アカウントの取得が必須です。ここでは、無料トライアルクレジット(90 日・300 USD)を受け取るまでの手順を、初心者でも迷わないように順番に解説します。
サインアップ手順
Google Cloud のトップページからコンソールへアクセスし、既存の Google アカウントでサインインします。利用規約とプライバシーポリシーに同意したら、氏名・電話番号を入力して SMS 認証を完了させます。
- ステップ 1:
https://cloud.google.com/→ 「コンソールへ」ボタン - ステップ 2:Google アカウントでログイン
- ステップ 3:利用規約に同意し、個人情報を入力
- ステップ 4:SMS に送信されたコードを入力して本人確認
無料トライアルクレジット取得
無料トライアルは支払い情報の登録が必要ですが、カードへの課金は手動で上限設定しない限り自動的には行われません。クレジット残高はコンソール左メニュー「課金」→「無料トライアル」で確認できます。
ポイント:メール認証と支払い情報の入力は必須です。90 日間、300 USD のクレジットが自動付与され、BigQuery を含む全サービスを制限なく試すことが可能です。
BigQuery のセットアップ:API 有効化とプロジェクト構築
BigQuery を利用するには API の有効化と、課金アカウントに紐づくプロジェクトの作成が必要です。本セクションでは、権限設定まで含めた手順を具体的に示します。
API 有効化手順
Google Cloud コンソールで BigQuery 関連 API を有効にすると、データロードや機械学習ジョブが実行できるようになります。公式ドキュメントは以下をご参照ください。
- コンソール上部の検索バーに「BigQuery」と入力し、表示されたサービスページへ移動
- 左側メニューの API とサービス → ライブラリ を開く
- 「BigQuery API」を検索して 有効化 ボタンをクリック
- 同様に Data Transfer Service も有効化(外部データ自動取り込み用)
プロジェクト作成と課金アカウント紐付け
プロジェクトはリソースの単位になるため、名前は業務で判別しやすいものを選びます。作成後に無料トライアルの課金アカウントを割り当てることで、BigQuery の使用料がクレジットから差し引かれます。
- コンソール左上「リソース」→「プロジェクトを選択」→「新しいプロジェクト」
- プロジェクト名(例:
my-bq-hands-on)と組織を入力して作成 - 作成したプロジェクトを開き、左メニュー 課金 → 「課金アカウントのリンク」を選択し、無料トライアルの課金アカウントを紐付け
権限設定のベストプラクティス
最小権限の原則に従い、必要なロールだけを付与します。典型的なハンズオンでは以下のロールが推奨されます。
| ロール | 説明 |
|---|---|
bigquery.user |
クエリ実行とジョブ作成権限 |
bigquery.dataEditor |
テーブル作成・データ書き込み権限 |
roles/viewer(オプション) |
プロジェクト全体の閲覧権限 |
データ探索とインポート:公開データセットと Cloud Storage からのロード
BigQuery の魅力は膨大なパブリックデータをすぐに検索できる点です。また、独自データを CSV/JSON で取り込む手順も併せて解説します。
パブリックデータセットの見つけ方
Google が提供する Public Datasets Catalog は、カテゴリ別に整理された数百のデータセットが利用可能です。以下の流れで目的のデータを探せます。
- コンソール左メニュー BigQuery → データセット を選択
- 上部タブから 「パブリック データセット」 をクリック
- カテゴリ(例:人口統計、気象、金融)を絞り込み、目的のテーブルを確認
たとえば bigquery-public-data.samples.natality は米国出生統計データで、スキーマやサンプルクエリが即座に表示されます。
CSV/JSON データのインポート手順
| 手順 | 操作内容 | 補足 |
|---|---|---|
| 1 | Cloud Storage バケットを作成し、ローカルファイル(CSV/JSON)をアップロード | コンソール → 「ストレージ」→「バケット作成」 |
| 2 | BigQuery コンソールで 「テーブルを作成」 を選択 | データ ソースは「Google Cloud Storage」 |
| 3 | ファイル形式(CSV/JSON)と自動スキーマ検出を設定 | 必要に応じて手動でフィールドタイプを調整 |
| 4 | テーブル名・データセットを指定し 作成 をクリック | パーティションやクラスタリングも同時設定可能 |
ポイント:自動スキーマ検出は便利ですが、数値が文字列として認識されるケースがあります。インポート後に
ALTER TABLEで型修正を行うと安全です。
SQL クエリ実行とコスト管理
BigQuery の UI と bq CLI を使って基本的なクエリを走らせ、料金の概算方法と削減テクニックを紹介します。
基本的な SELECT クエリ例
以下はパブリックデータセットから州別出生件数を集計するサンプルです。実行結果は UI でプレビューでき、CLI でも同様に取得可能です。
|
1 2 3 4 5 6 7 8 9 10 11 |
-- 州ごとの出生件数と平均体重(2020 年) SELECT state, COUNT(*) AS births, AVG(weight_pounds) AS avg_weight FROM `bigquery-public-data.samples.natality` WHERE year = 2020 GROUP BY state ORDER BY births DESC LIMIT 10; |
- Web UI:クエリエディタに貼り付けて「実行」ボタンをクリック。結果はテーブル形式で即座に表示されます。
- bq CLI:
bq query --use_legacy_sql=false 'SQL文' --format=prettyjsonと入力すると、JSON 形式でも取得できます。
料金概算と最適化テクニック
BigQuery の課金はスキャンしたデータ量に基づくオンデマンド方式が基本です。以下のポイントを抑えるだけでコストを大幅に削減できます。
| 項目 | 説明 |
|---|---|
| オンデマンド課金 | スキャンデータ量(TB)× $5 が標準レート |
| パーティショニング | 日付やキーでテーブルを分割し、必要なパーティションだけスキャン |
| クラスタリング | 頻繁にフィルタする列でソート保存し、スキャン量削減 |
| dry‑run(プレビュー) | bq query --dry_run で実行前にスキャン量を確認 |
| 料金アラート | コンソールの「予算とアラート」で上限設定 → クレジット残高が少なくなると通知 |
ポイント:ハンズオン段階ではオンデマンド課金で十分です。テーブル規模が大きくなったらパーティションやクラスタリングを導入し、定額スロットへの移行も検討しましょう。
BigQuery ML 入門:SQL だけで機械学習
BigQuery ML は SQL 文一つでモデル作成・予測が可能です。ここでは過去の公式ウェビナーで紹介された手順をベースに、線形回帰モデルの構築例を示します。
線形回帰モデル作成手順
|
1 2 3 4 5 6 7 8 9 10 11 |
-- 体重(weight_pounds)を目的変数とした線形回帰モデル CREATE OR REPLACE MODEL `my_dataset.birth_weight_pred` OPTIONS (model_type='linear_reg') AS SELECT CAST(weight_pounds AS FLOAT64) AS label, mother_age, gestation_weeks, parity FROM `bigquery-public-data.samples.natality` WHERE weight_pounds IS NOT NULL; |
予測実行とモデル評価
|
1 2 3 4 5 6 7 8 9 10 11 |
-- 作成したモデルで新しいデータの体重を予測 SELECT mother_age, gestation_weeks, parity, predicted_label AS predicted_weight FROM ML.PREDICT( MODEL `my_dataset.birth_weight_pred`, (SELECT 30 AS mother_age, 38 AS gestation_weeks, 1 AS parity) ); |
- 評価:
ML.EVALUATE(MODEL \my_dataset.birth_weight_pred)を実行すると、RMSE・R² などの指標が取得できます。 - 注意点:ML ジョブはデータスキャン量に応じてクレジットを消費しますが、サンプル規模が小さい場合は数ドル未満で済みます。
ポイント:欠損値除去と特徴量選択だけで、数行の SQL で実用的な回帰モデルが完成します。
ハンズオン後の活用例:Looker Studio とパイプライン構築
データ分析結果を可視化し、組織全体で共有する方法として Looker Studio(旧 Data Studio)への接続が便利です。また、定期的なデータ更新やリアルタイム予測に向けたパイプラインの概観も紹介します。
Looker Studio での可視化手順
-
データソース追加
Looker Studio の「データソース」画面で「BigQuery」を選択し、先ほど作成したデータセットとテーブルを指定。 -
レポート作成
グラフや表をドラッグ&ドロップで配置し、state別出生件数の棒グラフやavg_weightのトレンドラインなどを作成。 -
自動更新設定
データソースの「スケジュール」オプションで毎日または毎週クエリ結果を再取得し、ダッシュボードを常に最新状態に保ちます。
データフロー・Vertex AI 連携の概観
- Dataflow:Cloud Storage に格納された CSV を定期的に取り込み、BigQuery のパーティションテーブルへロード。
- Vertex AI:BigQuery ML で作成したモデルを Vertex AI にエクスポートし、REST API 経由でリアルタイム予測サービスとして提供。
このように、データ取得→分析→可視化→機械学習というフローが一つのプラットフォーム上で完結するため、開発工数と運用コストを大幅に削減できます。
記事の要点まとめ
- GCP アカウント と無料トライアルクレジット取得手順(2026 年版)
- BigQuery API 有効化、プロジェクト作成、課金アカウント紐付けと最小権限設定
- パブリックデータセット の検索方法と Cloud Storage 経由の CSV/JSON インポート手順
- 基本的な SQL クエリ 実行例と料金概算・コスト削減テクニック
- BigQuery ML による線形回帰モデル作成、予測実行、評価方法
- ハンズオン後の Looker Studio 可視化 と Dataflow/Vertex AI 連携によるエンドツーエンドパイプライン
上記の流れに沿って実践すれば、Google Cloud のデータ分析基盤を自力で構築し、業務レポートや機械学習プロジェクトへ即座に応用できます。ぜひ本手順を参考に、次世代のデータドリブン組織を目指してください。