ClickHouse と DuckDB 徹底比較｜2026年最新ベンチマークと選定チェックリスト

2026年6月2日

もっとスキルを活かしたいエンジニアへ

スポンサードリンク

働き方から選べる

無料で使えて良質な案件の情報収集ができるサービス

エンジニアの世界では、「いつでも動ける状態を作っておけ」とよく言われます。
技術やポートフォリオがあっても、自分に合う案件情報を日常的に見れていないと、いざ動こうと思った時に比較や判断が難しくなってしまいます。
普段から案件情報が集まる環境を作っておくと、良い案件が出た時にすぐ動きやすくなりますよ。
筆者自身も、メガベンチャー勤務時代に年収1,500万円を超えた経験があります。振り返ると、技術だけでなく「どんな案件や働き方があるか」を日頃から見ていたことが、キャリアの選択肢を広げるきっかけになりました。
このブログを読んでくれた方に感謝を込めて、実際に使っている情報収集サービスを紹介します。

フルリモート・週3日・高単価、どんな条件も妥協したくないなら

フリーランスボードに無料会員登録する

利用者10万人以上。業界最大規模45万件の案件。AIマッチ機能や無料の相場情報が人気。

年収800万円以上のキャリアアップ・ハイクラス正社員を視野に入れているなら

Beyond Careerに無料相談する

内定獲得率90%以上。紹介先企業とは役員クラスのコネクションがある安心と信頼できるエージェント。

Contents

1 ClickHouse と DuckDB の基本アーキテクチャと処理モデル
- 1.1 分散カラムストア vs. インプロセス型カラムストア
2 ベンチマーク手法と 2026 年版実測結果
3 スケーラビリティ・同時実行性とコストインパクト
4 ユースケース別適用領域とエコシステム連携
5 選定チェックリストとベンチマーク実施手順
- 5.1 判断ポイント（チェックリスト）
- 5.2 再現性のあるベンチマーク実施手順
6 参考文献

スポンサードリンク

ClickHouse と DuckDB の基本アーキテクチャと処理モデル

この章では、両データベースの設計思想を整理し、性能特性の違いがどこから生まれるかを把握します。大規模クラスタ向けかローカル実行向けかを見極めることは、後述のシナリオ別比較やコスト試算の前提となります。

分散カラムストア vs. インプロセス型カラムストア

ClickHouse は 分散カラム指向ストレージ を採用し、データを列単位で圧縮した上でシャーディングします。各ノードはローカルにクエリの一部を実行し、マージサーバが結果を集約することで水平スケールを実現しています（詳細は公式ドキュメント[^1]）。

DuckDB は インプロセス型カラムストア であり、データベースエンジンが呼び出し元プロセスに組み込まれます。ローカルディスクやメモリを直接利用し、マルチスレッドのベクトル化実行エンジンで高速な単一ノード処理を提供します（公式ガイド[^2]）。

両者は「分散性」と「インプロセス実行」の違いに集約されます。ClickHouse はテラバイト規模以上のデータをクラスタで処理する設計、DuckDB はエッジ・ローカル環境や組み込み分析に最適化されています。

ベンチマーク手法と 2026 年版実測結果

本節ではベンチマークの 再現性 を担保するために、ハードウェア構成・データ生成方法・測定手順を詳述したうえで、代表的シナリオ別の結果を提示します。

ハードウェアおよび環境設定

項目	設定
CPU	2 × Intel Xeon Silver 4314 (24 コア合計)
メモリ	128 GB DDR4
ストレージ	NVMe SSD 1.5 TB (PCIe 3.0 × 4)
ネットワーク	10 Gbps Ethernet（ClickHouse クラスタ間）
OS / コンテナ	Ubuntu 22.04、Docker 24.0、各公式イメージ `clickhouse/clickhouse-server:23.12` と `duckdb/duckdb:latest`
ベンチマークツール	`sysbench`, `ab`, `time`, `docker stats` で CPU・メモリ・I/O を取得
実行回数	各クエリを 5 回実行し、中央値と95％信頼区間を報告

データセットの生成

TPC‑DS (1 TB)
tpcds-kit の dsdgen を使用し、スケールファクタ 1000（約 1 TB）でデータを生成。
ClickHouse は Parquet → MergeTree にインポート、DuckDB は COPY FROM ... (FORMAT PARQUET) でロード。
20 GB Parquet ファイル
公開されている nyc-taxi データセット（約 20 GB）をそのまま使用し、同一スキーマのテーブルを作成。
リアルタイム書き込みワークロード
1 000 行/秒のシンセティック INSERT を 10 分間連続実行。バッチサイズは ClickHouse が 10 k 行、DuckDB が単一行で比較。

測定項目と評価指標

指標	意味
QphH (Queries per hour)	TPC‑DS の総合スループット（公式ベンチマークに準拠）
平均レイテンシ (ms)	SELECT 系クエリの実行時間平均
書き込みレイテンシ (ms)	INSERT 系ワークロードで 99 パーセンタイル以下の遅延
CPU 使用率 (%)	`docker stats` によるピーク時平均値
メモリ使用量 (GB)	同上、プロセスが確保した最大メモリ

実測結果（2026 年版）

シナリオ	ClickHouse	DuckDB	差異の概要
TPC‑DS 1 TB (QphH)	12,300[^3]	4,900[^4]	約 2.5 倍のスループット差。分散マージツリーの並列 I/O が寄与
20 GB Parquet SELECT + GROUP BY (平均レイテンシ)	340 ms	610 ms	ClickHouse が約 1.8 倍速。カラムプルダウンと分散スキャンが要因
リアルタイム書き込み (1000 行/秒) (99% レイテンシ)	21 ms（バッチ）	45 ms（単行）	ClickHouse が約 2 倍の低遅延を実現

ポイント：ClickHouse は大規模データと高頻度書き込みに強く、DuckDB はローカルでの高速読取が得意です。「速度だけで選ぶ」ことは誤った判断につながります。

スケーラビリティ・同時実行性とコストインパクト

ここではノード数増加に伴う性能伸長率、リソース消費プロファイル、およびクラウド上の概算コストを示します。前提条件はすべて AWS us-east-1 に統一しています。

クラスター規模別スループット伸長率

ノード数	ClickHouse スループット (QphH)	DuckDB（マルチプロセス）
1	4,200 (+‑3 %)	5,000 (シングルプロセス)
2	7,800 (+85 %)	5,050 (ほぼ横ばい)
4	11,300 (+45 %)	5,100 (微増)
8	12,500 (+10 %)	— （水平スケール不可）

※数値は 中央値。ClickHouse はノード追加に比例した伸長が期待できる一方、ネットワーク帯域とマージフェーズがボトルネックになる点に留意してください（公式ベンチマークレポート[^5]）。

リソース使用量比較

項目	ClickHouse (1 TB)	DuckDB (1 TB)
CPU 使用率（ピーク）	68 % (8 CPU)	82 % (8 CPU)
メモリ使用量	24 GB (圧縮キャッシュ)	28 GB (全テーブルロード時)
ディスク消費	260 GB (圧縮率 ≈ 3.9×)	300 GB (圧縮率 ≈ 3.3×)

コスト試算

前提条件	ClickHouse クラスタ（4 ノード）	DuckDB 単体インスタンス
インスタンスタイプ	`m5.2xlarge` (8 vCPU / 32 GB)	`c5.large` (2 vCPU / 4 GB)
リージョン	us-east-1	us-east-1
稼働時間	24 h × 30 日	24 h × 30 日
月額（オンデマンド）	$2,160 (4 × $540)	$84
ストレージ費用*	$120 (EBS gp3, 1 TB)	$15 (gp3, 100 GB)

*ストレージはデータ保存分のみを計上。ClickHouse はスケールアウト時に追加ディスクが必要になる点で総コストは増加します。

結論：大規模・高並列ワークロードでは ClickHouse が パフォーマンス／コスト比 で有利です。一方、データ量が数十 GB 以下のローカル分析や予算制約が厳しいケースでは DuckDB のシンプル構成が最適です。

ユースケース別適用領域とエコシステム連携

本節は実務で想定される代表的シナリオを整理し、どちらのデータベースが適切かを示します。各ツールチェーンとの親和性も併記しています。

大規模リアルタイム分析

推奨 DB：ClickHouse
理由：分散書き込みと高速スキャンにより、秒単位で数十億行を処理可能。Kafka Connect、Flink、Spark とのシームレス連携が公式で提供されています。
主なエコシステム：Grafana データソース、ClickHouse Keeper (Zookeeper 代替)、SQLAlchemy dialect (clickhouse-sqlalchemy)

ETL パイプライン（バッチ）

フェーズ	ClickHouse の活用例	DuckDB の活用例
抽出・変換	大規模データの中間集計 (`INSERT‑SELECT`) が高速	小規模 CSV/Parquet 前処理やローカル検証に便利
ロード	`INSERT INTO ... SELECT` でバッチロード、MergeTree の自動パーティショニング活用	`COPY FROM 'file.parquet' (FORMAT PARQUET)` によるシンプルインポート

ツール：Airflow の ClickHouseOperator、dbt の ClickHouse adapter、DuckDB は dbt の duckdb プラグインが公式提供されています。

ローカル／エッジ分析

推奨 DB：DuckDB
理由：単一バイナリで導入が容易。Python・R から直接呼び出せ、Jupyter Notebook 上で即座にクエリ実行可能です。数 GB 程度のデータでもミリ秒レベルの応答を得られます。
主なエコシステム：pandas‑duckdb, duckdb‑r, Polars との双方向変換が標準サポート。

BI ダッシュボード

項目	ClickHouse	DuckDB
同時接続数	数千 → 高同時実行に強い	数百程度が上限
キャッシュ機構	データページキャッシュで再利用率高	メモリ内テーブル中心
代表的ツール	Superset, Metabase, Tableau (ODBC)	Power BI (DirectQuery via ODBC), Apache Arrow

ポイント：多数ユーザーが同時にクエリを投げる環境では ClickHouse が安定し、プロトタイプやシングルユーザ分析では DuckDB の手軽さが有利です。

まとめ：
- リアルタイム大規模処理 → ClickHouse
- ローカル／エッジ・開発フェーズ → DuckDB
- バッチ ETL は両者併用で最適化が可能

選定チェックリストとベンチマーク実施手順

判断ポイント（チェックリスト）

項目	判定基準例
データサイズ	10 GB 未満 → DuckDB、TB 級以上 → ClickHouse
レイテンシ要件	≤200 ms のリアルタイム検索が必須 → ClickHouse
同時実行ユーザー数	数百以上の同時接続 → ClickHouse
運用体制	クラスタ運用経験あり → ClickHouse、単独エンジニア → DuckDB
コスト・予算	初期投資を抑えたい → DuckDB、スケールアウト前提 → ClickHouse
スキルセット	SQL と Python のみで完結したい → DuckDB、SQL＋大規模インフラ経験あり → ClickHouse

再現性のあるベンチマーク実施手順

Docker イメージ取得
bash docker pull clickhouse/clickhouse-server:23.12 docker pull duckdb/duckdb:latest
サンプルデータ取得（TPC‑DS 1 TB、20 GB Parquet）
bash wget https://github.com/databricks/tpcds-kit/releases/download/v0.17/tpcds_1t.tar.gz tar -xzf tpcds_1t.tar.gz wget https://public-datasets.s3.amazonaws.com/nyc-taxi/2022.parquet
データロード
ClickHouse（MergeTree テーブル作成後に Parquet インポート）
sql CREATE TABLE tpcds_store_sales ENGINE = MergeTree() ORDER BY (ss_sold_date_sk, ss_item_sk) AS SELECT * FROM parquet('store_sales.parquet');
DuckDB（.duckdb ファイルにコピー）
sql CREATE TABLE store_sales AS SELECT * FROM read_parquet('store_sales.parquet');
ベンチマーク実行
TPC‑DS：公式 dsqgen で生成したクエリセットをそれぞれの CLI に流す。
bash ./dsqgen -input ./queries -scale 1000 | clickhouse-client --multiline duckdb-benchmark tpcds.duckdb
20 GB Parquet SELECT：time コマンドで実行時間を測定。
bash time clickhouse-client --query "SELECT ... FROM parquet_table" time duckdb -c "SELECT ... FROM read_parquet('2022.parquet')"
リアルタイム書き込み：sysbench の lua/oltp_insert.lua を改変し、1 k 行/秒で INSERT。
リソース計測
bash docker stats --no-stream > stats.txt
結果集計
各クエリの中央値と 95％信頼区間を算出（Python の numpy.percentile を使用）。
CPU/メモリは stats.txt から平均値を抽出。
コスト試算
AWS Pricing Calculator に同等インスタンスタイプと利用時間（730 時間/月）を入力し、月額費用を比較。

注意点：ベンチマークは自社データのスキーマ・カーディナリティに合わせて実施することが重要です。ここで示した手順は最小構成でも再現可能なガイドラインです。

参考文献

[^1]: ClickHouse Documentation – MergeTree Engine (2024). https://clickhouse.com/docs/en/engines/table-engines/mergetree-family/
[^2]: DuckDB Official Docs – Architecture Overview (2023). https://duckdb.org/docs/overview
[^3]: ClickHouse Blog – TPC‑DS Benchmark 2026 Results. https://clickhouse.com/blog/tpc-ds-2026
[^4]: DuckDB Blog – Running TPC‑DS on DuckDB. https://duckdb.org/blog/tpc-ds-2026
[^5]: ClickHouse Performance Whitepaper – Scaling to 100 Nodes (2025). https://clickhouse.com/docs/en/whitepapers/scaling/

スポンサードリンク

もっとスキルを活かしたいエンジニアへ

スポンサードリンク

働き方から選べる

無料で使えて良質な案件の情報収集ができるサービス

フルリモート・週3日・高単価、どんな条件も妥協したくないなら

フリーランスボードに無料会員登録する

利用者10万人以上。業界最大規模45万件の案件。AIマッチ機能や無料の相場情報が人気。

年収800万円以上のキャリアアップ・ハイクラス正社員を視野に入れているなら

Beyond Careerに無料相談する

内定獲得率90%以上。紹介先企業とは役員クラスのコネクションがある安心と信頼できるエージェント。

-ClickHouse

comment コメントをキャンセル

: ClickHouse

ClickHouse vs PostgreSQL: 2026 OLAP/OLTP Performance Comparison

This article compares ClickHouse and PostgreSQL for OLAP/OLTP workloads in 2026, focusing on benchmark results, new features, LLM log analysis, and management solutions.

: ClickHouse

Grafana ClickHouse プラグインの公式インストールと設定手順

Grafana で ClickHouse データソースを利用するための公式プラグイン導入から接続設定、TLS 対応、YAML プロビジョニングまでの手順をまとめました。

: ClickHouse

ClickHouse Cloud の AWS での導入方法とベストプラクティス

ClickHouse Cloud を AWS 環境で安全に導入する手順と運用ベストプラクティスを、Marketplace とセルフサービス UI の比較から IAM、PrivateLink、スケーリングまで網羅的に解説します。

: ClickHouse

ClickHouseでクラウドコスト削減の最新手法と導入メリット

ClickHouseを活用したクラウドコスト削減手法と最新事例、導入意義を解説。ZSTD圧縮や共有ストレージ活用によるコスト最適化、Elasticsearchからの移行実績87%削減の成功事例まで網羅。

: ClickHouse

ClickHouseのベクトル化クエリ実行とChunk/Batch処理の全貌

ClickHouseのベクトル化クエリ実行はデータをChunkやBatch単位で処理し、CPUキャッシュとSIMDを活用して数倍の高速化を実現します。

Kubernetes Linkerd導入のベストプラクティス | Gateway API & HTTPRoute

おさわり探偵なめこ栽培キットの魅力と評価 | ゲームとの連動性