BigQuery Python接続ガイド｜手順とサンプルコード

2026年5月27日

もっとスキルを活かしたいエンジニアへ

スポンサードリンク

働き方から選べる

無料で使えて良質な案件の情報収集ができるサービス

エンジニアの世界では、「いつでも動ける状態を作っておけ」とよく言われます。
技術やポートフォリオがあっても、自分に合う案件情報を日常的に見れていないと、いざ動こうと思った時に比較や判断が難しくなってしまいます。
普段から案件情報が集まる環境を作っておくと、良い案件が出た時にすぐ動きやすくなりますよ。
筆者自身も、メガベンチャー勤務時代に年収1,500万円を超えた経験があります。振り返ると、技術だけでなく「どんな案件や働き方があるか」を日頃から見ていたことが、キャリアの選択肢を広げるきっかけになりました。
このブログを読んでくれた方に感謝を込めて、実際に使っている情報収集サービスを紹介します。

フルリモート・週3日・高単価、どんな条件も妥協したくないなら

フリーランスボードに無料会員登録する

利用者10万人以上。業界最大規模45万件の案件。AIマッチ機能や無料の相場情報が人気。

年収800万円以上のキャリアアップ・ハイクラス正社員を視野に入れているなら

Beyond Careerに無料相談する

内定獲得率90%以上。紹介先企業とは役員クラスのコネクションがある安心と信頼できるエージェント。

Contents

1 BigQuery Python API 接続の手順とサンプルコードを解説
2 Google Cloudプロジェクトの初期設定
- 2.1 プロジェクト作成とBigQuery APIの有効化
- 2.2 サービスアカウントの作成とJSON鍵ファイルの取得
3 OAuth2認証の手順と資格情報の準備
- 3.1 環境変数へのクレデンシャル設定
- 3.2 Service Account JSONファイルの読み込み
4 Pythonクライアントライブラリのインストール方法
- 4.1 必要なパッケージとバージョン一覧
- 4.2 pipによるインストール手順
5 BigQueryへのデータ挿入とクエリ実行サンプルコード
- 5.1 DataFrameからのデータ挿入処理
- 5.2 SQLクエリの実行例
6 エラーハンドリングのベストプラクティス
- 6.1 例外処理の基本構文
- 6.2 ログ出力とリトライロジック
7 まとめ

スポンサードリンク

BigQuery Python API 接続の手順とサンプルコードを解説

BigQueryへのPython接続は、データ分析やETL処理において重要なスキルです。本記事では、Google Cloudプロジェクトの設定からOAuth2認証、クライアントライブラリのインストールまで、実際に導入できる手順と実行可能なコードサンプルをステップバイステップで解説します。

Google Cloudプロジェクトの初期設定

BigQueryにPythonからアクセスするには、まずGoogle Cloudプロジェクトの準備が必要です。プロジェクト作成とAPI有効化が前提となるため、以下のような手順で進めます。

プロジェクト作成とBigQuery APIの有効化

Google Cloud Console（console.cloud.google.com）にアクセスし、「プロジェクトを作成」をクリックします。
プロジェクト名を入力し、場所を選択して「作成」を実行します。
左メニューの「APIとサービス」→「ライブラリ」を開き、「BigQuery API」を検索し有効化します。

注意：API有効化後は、プロジェクトID（例: my-project-123456）を控えておくことが重要です。このIDは認証処理やコード記述時に必要になります。

サービスアカウントの作成とJSON鍵ファイルの取得

BigQuery APIにアクセスするためには、サービスアカウントを作成し、その資格情報を管理します。

Google Cloud Console → 「IAMと権限」→「サービスアカウント」を開きます。
「サービスアカウントを追加」→「サービスアカウントを作成」を選択します。
名前とメールアドレスを入力し、ロールに「BigQuery Admin」を割り当てます。
「作成」後、「キーファイルのダウンロード」からJSON形式の鍵ファイル（例: service-account.json）を保存します。

補足：JSONファイルはセキュリティ上、適切な場所に保管し、Gitなどへのコミットは避けてください。失われる場合、再生成が必要になります。

OAuth2認証の手順と資格情報の準備

OAuth2認証を使用することで、BigQuery APIに安全にアクセスできます。この手順では、環境変数に資格情報を設定し、Pythonコード内で読み込む方法を紹介します。

環境変数へのクレデンシャル設定

サービスアカウントのJSONファイルを使ってOAuth2認証を行うには、以下のような環境変数を事前に準備します。

export GOOGLE_APPLICATION_CREDENTIALS=&quot;/path/to/service-account.json&quot;

1 2	export GOOGLE_APPLICATION_CREDENTIALS="/path/to/service-account.json"

注意：このパスは、service-account.jsonが保存されている実際の場所に置き換えてください。Linux/Macなら.bashrcや.zshrcに追記し、WindowsではPowerShellで[Environment]::SetEnvironmentVariable()を使用します。

Service Account JSONファイルの読み込み

Pythonコード内ではgoogle.authモジュールを使ってJSONファイルを読み込みます。以下は認証処理の基本的な流れです：

from google.oauth2 import service_account
credentials = service_account.Credentials.from_service_account_file(
    '/path/to/service-account.json',
    scopes=['https://www.googleapis.com/auth/bigquery']
)

from google.oauth2 import service_account

credentials = service_account.Credentials.from_service_account_file(

'/path/to/service-account.json',

scopes=['https://www.googleapis.com/auth/bigquery']

)

ポイント：scopesパラメータでアクセス権限を指定します。BigQuery APIの場合、https://www.googleapis.com/auth/bigqueryが必須です。

Pythonクライアントライブラリのインストール方法

PythonからBigQueryに接続するためには、google-cloud-bigqueryライブラリが必要です。以下のようにpipでインストールします。

必要なパッケージとバージョン一覧

パッケージ名	概要	推奨バージョン
`google-cloud-bigquery`	BigQuery APIへのアクセスを提供	3.10.0以上
`pandas`	DataFrameによるデータ操作に使用	最新版

pip install google-cloud-bigquery pandas

1 2	pip install google-cloud-bigquery pandas

注意：Pythonバージョンとライブラリの互換性には注意が必要です。3.7以上が推奨されます。

pipによるインストール手順

既存環境との互換性を考慮し、requirements.txtに記載して管理する方法も有効です。
特定バージョンの指定が必要な場合は以下のようにします：

pip install google-cloud-bigquery==3.10.0

1 2	pip install google-cloud-bigquery==3.10.0

補足：最新版が常に最適とは限らないため、テスト環境で動作確認をしたバージョンを使用することを推奨します。

BigQueryへのデータ挿入とクエリ実行サンプルコード

BigQueryは、DataFrameから直接データをアップロードできるほか、SQLクエリを実行して結果を得ることも可能です。以下に代表的な処理のコード例を紹介します。

DataFrameからのデータ挿入処理

Pandas DataFrameを使ってBigQueryへデータを挿入するには、to_gbq()関数を使用します。

from google.cloud import bigquery
import pandas as pd

# BigQueryクライアントの初期化
client = bigquery.Client()

# サンプルDataFrameの作成
df = pd.DataFrame({
    'name': ['Alice', 'Bob'],
    'age': [25, 30]
})

# DataFrameをBigQueryに挿入
table_id = &quot;my_dataset.my_table&quot;
job_config = bigquery.LoadJobConfig(write_disposition=&quot;WRITE_TRUNCATE&quot;)
job = client.load_table_from_dataframe(df, table_id, job_config=job_config)
job.result()

from google.cloud import bigquery

import pandas as pd

# BigQueryクライアントの初期化

client = bigquery.Client()

# サンプルDataFrameの作成

df = pd.DataFrame({

'name': ['Alice', 'Bob'],

'age': [25, 30]

})

# DataFrameをBigQueryに挿入

table_id = "my_dataset.my_table"

job_config = bigquery.LoadJobConfig(write_disposition="WRITE_TRUNCATE")

job = client.load_table_from_dataframe(df, table_id, job_config=job_config)

job.result()

注意：write_dispositionパラメータで挿入時の動作を指定できます。"WRITE_TRUNCATE"は既存データを上書きします。

SQLクエリの実行例

BigQueryに登録されたテーブルに対してSQLクエリを実行するには、以下のコードを使用します：

query = &quot;&quot;&quot;
SELECT name, AVG(age) AS avg_age
FROM `my_dataset.my_table`
GROUP BY name;
&quot;&quot;&quot;

# クエリの実行と結果取得
query_job = client.query(query)
results = query_job.result()
for row in results:
    print(f&quot;{row.name}: {row.avg_age}&quot;)

query = """

SELECT name, AVG(age) AS avg_age

FROM `my_dataset.my_table`

GROUP BY name;

"""

# クエリの実行と結果取得

query_job = client.query(query)

results = query_job.result()

for row in results:

print(f"{row.name}: {row.avg_age}")

ポイント：クエリの実行は非同期に動作し、result()メソッドで完了を待つ必要があります。

エラーハンドリングのベストプラクティス

BigQuery APIとの接続にはネットワークや認証エラーが発生する可能性があるため、適切なエラーハンドリングが必要です。

例外処理の基本構文

Pythonではtry-exceptブロックを使って異常処理を行います。以下は基本的な使用例です：

from google.api_core.exceptions import GoogleAPICallError

try:
    # BigQuery API呼び出し処理
    query_job = client.query(query)
except GoogleAPICallError as e:
    print(f&quot;API呼び出しが失敗しました: {e}&quot;)
except Exception as e:
    print(f&quot;予期せぬエラーが発生しました: {e}&quot;)

from google.api_core.exceptions import GoogleAPICallError

try:

# BigQuery API呼び出し処理

query_job = client.query(query)

except GoogleAPICallError as e:

print(f"API呼び出しが失敗しました: {e}")

except Exception as e:

print(f"予期せぬエラーが発生しました: {e}")

注意：google.api_core.exceptionsモジュールには具体的なエラーコードが含まれており、特定の例外に対して対処できます。

ログ出力とリトライロジック

実際には、ログを記録して原因を追跡し、リトライ可能なエラー（例: 一時的なネットワーク障害）に対応することが重要です。以下は簡単なリトライ処理の例です：

from tenacity import retry, stop_after_attempt, wait_exponential

@retry(stop=stop_after_attempt(3), wait=wait_exponential(multiplier=1, max=5))
def safe_query(query):
    query_job = client.query(query)
    return query_job.result()

from tenacity import retry, stop_after_attempt, wait_exponential

@retry(stop=stop_after_attempt(3), wait=wait_exponential(multiplier=1, max=5))

def safe_query(query):

query_job = client.query(query)

return query_job.result()

補足：tenacityライブラリは、リトライロジックを簡潔に記述できる便利なツールです。

まとめ

Google Cloudプロジェクトの初期設定では、プロジェクト作成とAPI有効化が不可欠
OAuth2認証にはサービスアカウントJSONファイルと環境変数の設定が必要
google-cloud-bigqueryライブラリをpipでインストールし、DataFrameからデータ挿入やSQLクエリ実行が可能
実際のコードではエラーハンドリングとログ出力を必ず記述し、リトライロジックも検討

記事内のコードをコピーしてすぐに試してみましょう。公式ドキュメントと併用することで効率的な導入手順が得られます。

スポンサードリンク

もっとスキルを活かしたいエンジニアへ

スポンサードリンク

働き方から選べる

無料で使えて良質な案件の情報収集ができるサービス

フルリモート・週3日・高単価、どんな条件も妥協したくないなら

フリーランスボードに無料会員登録する

利用者10万人以上。業界最大規模45万件の案件。AIマッチ機能や無料の相場情報が人気。

年収800万円以上のキャリアアップ・ハイクラス正社員を視野に入れているなら

Beyond Careerに無料相談する

内定獲得率90%以上。紹介先企業とは役員クラスのコネクションがある安心と信頼できるエージェント。

-GCP

comment コメントをキャンセル

: GCP

GCP AI Platform実装ガイド｜環境構築からモデルデプロイまで

GCP AI Platformの初期設定からVector Search連携、Docker環境構築、OpenAI API統合までを解説。モデルデプロイ時の課題対策と専門家活用も。

: GCP

BigQueryで実装する最新地理空間分析事例とベストプラクティス

本記事では、BigQueryのST_GEOGPOINT・ST_BUFFERなど主要関数を活用した不動産市場分析、ハリケーン進路可視化、Earth Engine連携事例と、大規模データ向け最適化・セキュリティ対策を具体的なSQLで解説します。

: GCP

2026年版 GCP AI料金比較とスタートアップ向けクレジット活用ガイド

2026年4月時点のGCP AIサービス料金を円換算で提示し、スタートアップ向けクレジット活用法とAWS・Azureとのコスト比較、ユースケース別シミュレーションをご紹介します。

: GCP

Google Cloud AIサービス2026年新機能と導入事例まとめ

Google Cloud の主要 AI サービスは 2026 年にマルチモーダルモデルや低遅延推論など新機能を追加し、飲料メーカーのチャットボット精度向上や大手企業のコスト削減事例が報告されています。

: GCP

2026年版 BigQuery ストレージ料金とコスト最適化ガイド

本記事では、東京リージョンにおけるBigQueryのアクティブと長期ストレージ料金を比較し、Standard・Enterpriseエディションへの切替やテーブル自動ライフサイクル設定、パーティション＆クラスタリング設計、マテリアライズドビューやBI Engine活用によるコスト削減手法を具体的なSQL例とともに解説します。

戸建て光回線の選び方：コスト効率を重視した最新比較

受託開発エンジニアのスキルセットと転職対策 | 技術・非技術両面からの解説