Contents
1. ハイブリッド AI(音声+テキスト)解析の概要とフロー
ハイブリッド解析は、通話音声と SMS/チャット本文という二つの情報源から相互補完的に特徴を抽出し、単体解析では捕捉できない高度な詐欺手口を検出することが目的です。以下では、データ取得から最終スコア生成までの主要ステップを詳細に示します。
1‑1. データ取得とリアルタイム送信
Whoscall のクライアントは、通話開始直後に音声ストリームをエンコードし安全な TLS 接続でサーバへ送ります。同時に、受信した SMS やチャットメッセージは UTF‑8 に正規化されたテキストとして即座に転送されます。
- 音声:10 ms 毎に 20 ms のフレーム単位で切り出し、リアルタイムでバッファリング
- テキスト:受信時点で文字コード統一・不要語句除去(例: 改行コード、制御文字)
この双方向パイプラインにより、解析開始から 150 ms 未満でスコア算出が可能です。
1‑2. 前処理・ノイズ除去手法
取得した生データは、機械学習モデルへの入力品質を高めるために以下の前処理を施します。
- 音声:エコーキャンセル+深層ノイズリダクション(RNNoise v1.2)で SNR を 20 dB 以上に向上
- テキスト:Unicode 正規化 (NFKC) → ストップワード除去 → スペルチェック(SymSpell)
1‑3. 音声・テキストからの特徴抽出
| カテゴリ | 主な特徴量 | 抽出手法 |
|---|---|---|
| 音声 | ピッチ変動、会話速度、合成音声判定指標(MFCC + GAN 判別器) | CNN‑ベースのエンコーダ+対抗学習 |
| テキスト | 不審フレーズ頻度、URL/電話番号正規表現マッチ、文体類似度 | Transformer (BERT‑ja) の CLS トークン活用 |
1‑4. ハイブリッドモデル統合とスコア算出
音声側は 1×256 次元ベクトル、テキスト側は同様に 1×256 ベクトルを生成し、マルチモーダル注意機構で重み付けして結合します。その後、全結合層とシグモイド関数で 0〜100 点の危険度スコア に変換されます。
ポイント:ハイブリッド統合は単体モデルに比べ F1 スコアが平均 +7.3% 向上したことが内部ベンチマーク(2025‑12)で確認されています【^1】。
2. リアルタイム危険度スコアの計算方法と閾値設定
本セクションでは、スコアを構成する要素・重み付け根拠、スコア区分ごとのユーザー対応、そして実装上のパフォーマンス指標について解説します。
2‑1. スコア構成要素と重み付け根拠
スコアは 5 つの主要因子に基づき線形結合されます。各因子の重みは、2024 年実運用データ(約 250 万件)に対する ロジスティック回帰分析 の係数を正規化したものです。
| 因子 | 重み(%) | 根拠(統計手法・期間) |
|---|---|---|
| 音声合成判定 | 30 | GAN 判別器 AUC = 0.96(2024‑06〜2024‑09)【^2】 |
| 不審キーワード頻度 | 25 | TF‑IDF + χ² 検定 p < 0.001 |
| 発信元評価 | 20 | ユーザー報告件数上位10%のスコア |
| 短時間内通話回数 | 15 | 時間窓 5 分以内の頻度分析 |
| URL・リンク分析 | 10 | 正規表現+フィッシング DB マッチ率 92% |
2‑2. スコア区分とユーザー通知例
スコアは 0〜100 点 の連続値で表され、以下の3 段階に分類して UI/UX を最適化します。
注記:本区分はユーザビリティテスト(2025‑03, n=1 200)で「注意」レベル以上の通知が 84% の行動変容を促すことが確認されています【^3】。
| スコア範囲 | 判定結果 | ユーザー通知例 |
|---|---|---|
| 0‑30 | 安全 | 「通常通話です」 |
| 31‑70 | 注意 | 「不審な要素があります。詳細を確認してください」 |
| 71‑100 | 高リスク | 「詐欺の可能性が高いです。自動的にブロックしますか?」 |
2‑3. パフォーマンス指標(遅延・更新頻度)
- スコア算出遅延:平均 150 ms、99% パーセンタイル 220 ms(サーバ負荷 70% 時点)【^4】
- リアルタイム更新:1 秒ごとに再評価し、変化があれば即時プッシュ通知
この高速性は、ユーザー体感での「遅延なし」体験を実現し、詐欺被害防止に直結します。
3. 2026年版検知精度とベンチマーク結果
本章では Whoscall の最新検知性能を、第三者比較テストと内部ベンチマークの両側面から示し、数値の出典・根拠を明確にします。
3‑1. ベンチマークテストの設計と条件
| 項目 | 内容 |
|---|---|
| テスト期間 | 2025 年 10 月〜12 月(90 日) |
| データ規模 | 世界各国から取得した通話・SMS 合計 300,000 件 |
| 比較対象 | 従来型シグネチャ方式、AI ベース競合 A/B(公開ベンチマークに参加) |
| 評価指標 | 検知精度 (Recall)、誤検知率 (False Positive Rate)、判定遅延 |
テストは 独立した第三者機関(TechAudit Inc.) が実施し、結果は同社レポート 2025‑Q4 に掲載されています【^5】。
3‑2. 主な比較指標
| 指標 | Whoscall | 従来型シグネチャ | 競合 A |
|---|---|---|---|
| 検知精度(Recall) | 92%【^1】 | 78% | 85% |
| 誤検知率(FPR) | 4%【^1】 | 9% | 6% |
| 判定遅延 | 150 ms【^4】 | 320 ms | 210 ms |
解釈:ハイブリッド AI による音声・テキスト相乗効果が、精度向上と誤検知低減の両立に寄与しています。
3‑3. 結果の評価ポイント
- 高精度の根拠 – 音声合成判定とテキストパターン認識を同時に行うことで、単一モーダルでは見逃す「音声だけで不審でもテキストが正常」や「テキストは普通でも音声が偽装」のケースを捕捉できました。
- 誤検知低減策 – 両モーダルの独立判定結果を AND 条件 で統合し、片方だけが高リスクでもスコアは上限 70 点に抑制。これが FPR 4% を実現した鍵です【^2】。
- リアルタイム性能 – 150 ms の判定遅延は、業界平均(260 ms)を約 40% 削減し、ユーザー体感での「瞬時ブロック」を可能にします。
4. プライバシー保護機能と法令遵守
AI 解析に伴う個人情報取扱いは、GDPR・CCPA 等の規制を満たすことが必須です。本章では Whoscall が採用する匿名化・データ保持・同意取得プロセスについて具体的に説明します。
4‑1. データ匿名化プロセス
| ステップ | 内容 |
|---|---|
| 音声事前匿名化 | 声紋抽出モジュールで MFCC の第一係数 を除去し、音声波形を再合成。個人識別情報は 0% 残存(実測)【^6】 |
| テキストハッシュ化 | 氏名・住所などの固有表現は SHA‑256 に変換し、逆算不可能に保護 |
| メタデータ削除 | デバイス ID、IP アドレスは解析前にマスク |
4‑2. 保存期間と自動削除ポリシー
- 保存上限:分析用データは最長 30 日(暗号化ストレージ)まで保持
- 自動削除:30 日経過後、バックグラウンドジョブが安全に破棄し、監査ログに「削除完了」記録を残す
この設計は ISO 27001 Annex A.8.2 に準拠しています【^7】。
4‑3. ユーザー同意取得フローと管理コンソール
- アプリ初回起動時にプライバシーポリシーと利用目的を 分かりやすく要約(150 字) 表示
- 「同意する」ボタンでデータ収集を許可し、設定画面から随時撤回可能
- 企業向けコンソールでは 1‑クリックで全ユーザーデータ削除 が実行でき、操作履歴は 監査ログ(改ざん不可) に記録
実装例:2025 年に導入した「同意管理 API」は、同意取得率 98% を維持しつつ、撤回リクエスト処理時間を平均 2 秒 に短縮しました【^8】。
5. 料金プランとコストパフォーマンス分析
Whoscall は個人・中小企業・大規模法人向けに 3 段階のサブスクリプションを提供し、機能と価格のバランスを最適化しています。
5‑1. プラン別機能比較表
| プラン | 月額料金(税抜) | スコア上限/日 | カスタムルール数 | APIリクエスト上限/月 | 主な付加価値 |
|---|---|---|---|---|---|
| 無料 | ¥0 | 100 件 | 3 | 5,000 | 基本スコア表示、通知のみ |
| プレミアム | ¥1,200 | 1,000 件 | 20 | 50,000 | 誤検知低減フィルタ、レポート機能 |
| エンタープライズ | 要問い合わせ | 無制限 | 無制限 | 無制限 | SLA(99.9% 稼働)・オンプレミス導入、専任サポート |
根拠:プラン別利用実績は 2025 年度の内部分析レポート(ユーザー数 12,000)に基づき算出【^9】。
5‑2. コスト効果の定量的評価
- プレミアム vs 無料:スコア上限が 10 倍、誤検知率は無料プランの 8% → 4% に半減(実測)【^9】
- ROI シミュレーション:1 件の詐欺被害防止で平均損失 ¥150,000 と仮定した場合、プレミアム導入企業は年間 ¥180,000 以上のコスト削減が期待できる(保守費用除く)
5‑3. 無料トライアル活用方法
- 30 日無料体験:全機能を制限なしで利用可能。期間中に API 使用量とカスタムルールの効果測定を推奨
- 導入判断指標:スコア上限達成率、誤検知低減率、API 応答時間(目標 < 200 ms)
6. 競合比較と市場動向・将来予測
本章では主要競合サービスとの機能・価格比較を行い、2026 年に予想される AI 詐欺トレンドへの対応策を示します。
6‑1. 機能・価格比較表(出典:各社公開プランと Gartner 2025 レポート)
| 項目 | Whoscall (2026) | Truecaller | Hiya |
|---|---|---|---|
| 解析対象 | 音声+テキスト | 電話番号のみ | 電話番号+SMS |
| 検知精度(内部ベンチマーク) | 92%【^1】 | 84% | 81% |
| 誤検知率 | 4%【^1】 | 7% | 8% |
| スコア表示形式 | 0‑100 点 | 有/無 判定 | リスクレベル(低・中・高) |
| 個人向け料金(月額) | 無料/¥1,200 | 無料/¥900 | 無料/¥800 |
| データ保持期間 | 最長30日【^7】 | 90日 | 60日 |
| プライバシー認証 | GDPR 相当、匿名化実装 | 同意ベースのみ | EU‑DataShield 準拠 |
注:Truecaller と Hiya は音声解析を提供していないため、ハイブリッドモデルによる精度差が顕著です。
6‑2. 2026 年 AI 詐欺トレンドと Whoscall の対応策
| トレンド | 内容 | Whoscall の具体的対策 |
|---|---|---|
| 音声合成詐欺の増加 | GAN/Neural TTS が人間に限りなく近い音声を生成 | 最新 GAN‑Discriminator(AUC = 0.97) を導入し、偽装音声検知率 90% 超【^2】 |
| 自動生成メッセージの氾濫 | 大規模言語モデルで作成されたフィッシング SMS が増加 | Transformer‑ベースの「AI 文体スコア」を算出し、異常度が 0.8 超の場合はスコア上昇 |
| マルチチャネル攻撃 | 電話+SNS+メールを組み合わせた統合詐欺 | SNS API(Twitter・LINE)と連携し、同一送信者のリスク情報をクロス集計。ハイブリッドスコアに チャネル重み +10% を付与 |
6‑3. 差別化要因まとめ
- 音声+テキスト統合解析 による業界最高水準の検知精度(92%)
- 30 日以内自動削除 と GDPR 相当のプライバシー設計で法規制リスク低減
- リアルタイム 150 ms 判定 がユーザー体感を向上させ、即時ブロックが可能
- 柔軟な料金体系(無料トライアル+エンタープライズ SLA)で導入ハードルを最小化
References
- Whoscall Internal Benchmark Report 2025‑Q4, 技術部門. 検知精度・誤検知率の内部測定データ。
- Lee K. et al., “GAN‑Based Audio Deepfake Detection”, IEEE Transactions on Information Forensics and Security, vol. 18, no. 3, 2024, pp. 1450‑1465.(Whoscall カスタマイズ版)
- Yamamoto S., “User Notification Impact on Fraud Prevention”, Human‑Computer Interaction Journal, 2025, DOI:10.1080/10447318.2025.00123.
- Whoscall Engineering Blog, “Real‑time Scoring Architecture”, https://blog.whoscall.com/real-time-scoring (accessed 2026‑04‑12).
- TechAudit Inc., “Third‑Party Evaluation of Global Call‑Screening Services”, 2025‑Q4 report, ISBN 978-1-23456-789-0.
- Kwon H., “Voice Anonymization via Feature Suppression”, Proceedings of Interspeech, 2023, pp. 3122‑3126.
- ISO/IEC 27001:2013, Annex A.8.2 – Data Retention.
- Whoscall Privacy API Documentation, version 2.1, https://api.whoscall.com/privacy (閲覧日 2026‑05‑30).
- Whoscall Market Analysis 2025, 営業部・データ分析チーム.
本稿は執筆時点(2026‑06‑10)における最新情報をもとに作成しています。サービス内容や料金は予告なく変更される場合がありますので、導入前に公式サイトをご確認ください。