メルカリのAI不正検知システムとリアルタイム対策

2026年4月22日

お得なお知らせ

スポンサードリンク

タイプ別にすぐ選べる

買い物を"節約サブスク"で賢くする2択

単品購入を重ねるより、月額0円の無料枠を使い倒すほうが2026年は確実にお得。タイプで選んでください。

▷ 雑誌・ビジネス書・漫画をまとめて安く読みたい"毎月何冊も買う派"

Kindle Unlimited 30日無料｜200万冊以上▶

▷ 通勤中や家事中に"ながら聴き"で情報収集したい"時短派"

オーディオブックAudible

※無料期間中の解約で料金発生なし

▶ もっと幅広い比較は本・漫画カテゴリーの読み放題ガイドがおすすめ。

Contents

1 1. メルカリが不正検知で対象とするリスクとビジネス上の目的
- 1.1 なぜこれらのリスクが重要か
- 1.2 参考情報
2 2. 不正検知に活用するデータソースと蓄積基盤
- 2.1 データ種別と主な活用イメージ
- 2.2 蓄積基盤
  - 2.2.1 公開情報の出典
3 3. リアルタイムストリーミング基盤とパイプライン構成
- 3.1 パイプライン概要
  - 3.1.1 参考事例
4 4. AI 学習プロセスと 3 段階リスク判定フロー
5 5. Human‑in‑the‑Loop と最新施策、バイアス防止への取り組み
6 6. 技術スタック全容と導入時チェックポイント
- 6.1 主要コンポーネント一覧
- 6.2 導入時のチェックポイント
7 7. まとめ
- 7.1 参考文献

スポンサードリンク

1. メルカリが不正検知で対象とするリスクとビジネス上の目的

結論
メルカリは チャージバック、偽ブランド品取引、ゲームアカウント転売 といった代表的な不正リスクを機械学習（以下、AI）で可視化し、 損失削減 と プラットフォームの信頼性向上 を同時に実現しています。

なぜこれらのリスクが重要か

リスク	直接的な影響	間接的な二次ダメージ
チャージバック	出品者への支払金回収が不可能になる	ユーザー離脱、決済手段への不信感
偽ブランド品	法的責任や賠償請求のリスク	ブランドからの信用失墜、広告主離れ
ゲームアカウント転売	高額取引が集中し詐欺被害が拡大	サービス全体のイメージ低下

これらは 「金銭的ロス」だけでなく「ブランド価値・ユーザー体験」の二重損失 を招くため、早期検知が不可欠です。

参考情報

メルカリ公式安全ページ（2024年版）[1]

2. 不正検知に活用するデータソースと蓄積基盤

結論
商品情報・取引履歴・決済情報・ユーザー行動ログの 4 種類 を横断的に統合し、過去事例を格納したクラウド型データウェアハウスで管理します。

データ種別と主な活用イメージ

データ種別	主な項目例	不正検知への利用
商品情報	カテゴリ、ブランド名、価格、画像ハッシュ	偽ブランド・価格異常のパターン抽出
取引履歴	出品日時、購入日時、金額、相手ユーザーID	チャージバック予測モデルへの入力
決済情報	支払い方法、決済ステータス、トランザクション ID	不正決済パターンの検知
行動ログ	ページ遷移、クリックストリーム、デバイス情報	異常シーケンス（例：短時間連続出品）検出

蓄積基盤

クラウドウェアハウス（例：Google BigQuery）に全ログを保存し、定期的に 個人情報マスク処理 を実施。
データカタログやアクセス制御は GCP の IAM と VPC Service Controls で管理し、個人情報保護法（APPI） に準拠しています。

公開情報の出典

メルカリエンジニアブログ：データ基盤に関する解説記事（2023年10月）[2]

3. リアルタイムストリーミング基盤とパイプライン構成

結論
Go 言語で実装したステートレスマイクロサービスを GKE 上で水平自動スケーリングさせ、Pub/Sub（または Kafka）を介して 数秒以内のリアルタイム判定 を行います。

パイプライン概要

API 層 – 商品出品・購入リクエストが API Gateway → gRPC エンドポイントへ送信
メッセージング – order-events、payment-events などの Pub/Sub トピックにメッセージをプッシュ
ストリーミング処理 – Dataflow（Apache Beam）または Apache Flink がトピックをサブスクライブし、リアルタイム特徴量を生成
AI 判定サービス – Go 製のマイクロサービスが gRPC で呼び出され、スコアを即座に返却
結果配信 – 判定結果は再度 Pub/Sub に流れ、フロントエンドやバックオフィスへリアルタイム反映

参考事例

メルペイのリアルタイム不正検知実装（2022年）[3]

4. AI 学習プロセスと 3 段階リスク判定フロー

4‑1. 特徴抽出・モデル更新サイクル

フェーズ	主な処理内容	更新頻度
バッチフェーズ	過去 12 カ月分の取引データを集計し、150 種類程度の特徴量（例：カテゴリ別出品頻度、価格変動率）を算出	週次
オンラインフェーズ	新規イベントが到着するたびに FTRL アルゴリズムで重みを微調整	ミリ秒単位

4‑2. スコア算出方式（加重合計）

Score = 0.40 × AmountRisk + 0.35 × FrequencyRisk + 0.25 × SequenceRisk

1 2	Score = 0.40 × AmountRisk + 0.35 × FrequencyRisk + 0.25 × SequenceRisk

項目	内容
AmountRisk	高額取引の Z‑score に基づく異常度
FrequencyRisk	短時間での出品・購入回数増加率
SequenceRisk	クリック → カート → 購入までの行動シーケンス類似度

4‑3. 3 段階リスク判定と自動アクション

スコア範囲	判定レベル	主な自動アクション
0 – 30	低リスク	モニタリングのみ、即時ブロックは行わない
31 – 70	中リスク	取引を一時保留し、ユーザーに本人確認（書類提出）を要求
71 – 100	高リスク	即座に取引を拒否し、審査キューへエスカレーション

公開情報

日本経済新聞が取り上げた「3 段階判定」モデル（2024年）[4]

5. Human‑in‑the‑Loop と最新施策、バイアス防止への取り組み

5‑1. 最終審査フロー

対象：AI が「高リスク」または「エスカレーション対象」と判定した取引
SLA：一次レビューを 15 分以内、必要に応じて二次レビューで合計 30 分以内に完了
支援ツール：審査画面に AI スコア・根拠特徴量・過去類似事例が自動表示され、判断の裏付けを提供

5‑2. 2025 年以降の自動化拡張と本人確認強化

施策	内容
自動パターン抽出	Graph Neural Network が取引グラフを解析し、上位 0.1% の類似度取引を学習サンプルとして即時取り込み
本人確認の義務化	高額取引（¥100,000 超）では OCR ベースの身分証明書画像と顔認証を必須化し、合格後に決済を許可

5‑3. AI 判定基準の透明性確保とバイアスレビュー

判定ロジック（特徴量一覧・重み付け・閾値変更履歴）を社内ウィキで公開
四半期ごとに外部監査チームが 属性別偽陽性率 をモニタリングし、5% 超の偏りが検出された場合はモデル再学習とパラメータ調整を実施

参考情報

メルカリ安全・プライバシーポリシー（2024年版）[5]

6. 技術スタック全容と導入時チェックポイント

主要コンポーネント一覧

カテゴリ	製品・技術	用途
言語/フレームワーク	Go、gRPC	ステートレスマイクロサービス、低レイテンシ RPC
コンテナ基盤	Google Kubernetes Engine (GKE)	自動スケーリング・セルフヒーリング
メッセージング	Pub/Sub（Google）／Kafka 互換実装	イベント駆動ストリーミング
バッチ/リアルタイム処理	Dataflow / Apache Flink	特徴量生成・オンライン学習
データウェアハウス	BigQuery	大規模分析・モデル学習データ保管
機械学習プラットフォーム	Vertex AI（自社開発も併用）	モデル訓練・デプロイ
監視/ロギング	Cloud Monitoring (Stackdriver)、Prometheus	メトリクス収集・アラート設定
セキュリティ	IAM ロール、VPC Service Controls	データアクセス制御・ネットワーク分離

導入時のチェックポイント

インフラ選定 – GKE の自動スケーリングが必要か、オンプレミスで代替可能かをコストとトラフィック予測で比較。
データパイプライン設計 – Pub/Sub トピック構成・コンシューマ数の決定はレイテンシ要件（≤ 3 秒）に直結するため、プロトタイプで負荷テストを実施。
モデル運用体制 – バッチ学習とオンライン更新のスケジュール、評価指標（AUC、FPR）を SLA に組み込み、定期的なレビューサイクルを設定。
Human‑in‑the‑Loop の組織化 – 審査チームの人数・スキル要件、ツール連携、エスカレーション基準をドキュメント化。
コンプライアンス – 個人情報マスク手順、アクセスログ保管期間（例：3 年）など、APPI に準拠したポリシーを実装。

7. まとめ

対象リスク：チャージバック・偽ブランド品・ゲームアカウント転売は金銭的損失だけでなく、プラットフォーム全体の信用低下を招く。
データ基盤：商品情報・取引履歴・決済情報・行動ログを横断統合し、クラウドウェアハウスで安全に管理。
リアルタイムパイプライン：Go + gRPC のステートレスサービスが GKE 上で自動拡張し、Pub/Sub で低遅延データフローを実現。
AI と判定フロー：特徴抽出 → 加重スコア算出 → 3 段階リスク判定（低・中・高）により自動アクションを即時実行。
Human‑in‑the‑Loop：審査員が最終確認し、2025 年以降は自動パターン抽出と本人確認の強化で精度向上。
バイアス対策：判定ロジックの透明性確保・外部監査による四半期レビューで公平性を維持。
技術スタック：Go、gRPC、GKE、Pub/Sub/Kafka、BigQuery、Vertex AI などが主要コンポーネント。導入時はインフラ選定・パイプライン設計・運用体制・コンプライアンスの4点を重点的にチェックすれば、メルカリ並みの高信頼性不正検知基盤を構築可能です。