Contents
河合塾One AI の全体構成と問題配信プロセス
河合塾One AI は、学習者の解答履歴や動画視聴情報を瞬時に取得し、そのデータをもとに「次に必要な」問題を自動で届ける仕組みです。この章では、データ取得 → リアルタイム解析 → 問題配信 の3段階がどのように連携しているかを解説します。
データ取得と前処理
学習者が画面上で行った操作はすべてサーバへリアルタイムで送られ、以下の項目に分類されます。
- 解答ログ:正誤・回答時間・選択肢パターンを数値化した情報
- 学習履歴:取り組んだトピックや出題回数をタイムスタンプで管理
- 行動データ:動画の再生・停止・リプレイ回数などの操作ログ
取得したデータは欠損値除去やカテゴリ変換といった前処理を経て、ベイジアンネットワークとレコメンドエンジンが扱える統一フォーマットに整形されます。
リアルタイム解析フロー
前処理済みデータは同時に二つのモデルへ供給されます。
- ベイジアンネットワーク が概念間の因果関係を評価し、未習得概念の確率分布を算出します。
- 適応学習モデル が現在の理解度スコアと過去の学習パターンを比較し、難易度調整指標を生成します。
この二段階解析は数百ミリ秒以内に完了し、次の問題画面へ遷移した瞬間に結果が反映されます。
問題配信アルゴリズム概要
解析結果から抽出された「未習得概念」と「適切な難易度」を組み合わせ、レコメンドエンジンが問題プールから最適な問題を選びます。
- 概念優先:確率が低い(=未習得)概念を上位に抽出
- 難易度微調整:理解度スコアに応じて標準偏差 ±1 の範囲で難易度を決定
- 多様性保持:同一概念の連続出題を防ぐため、直近に出した問題は除外
このプロセスにより、学習者は常に「次に克服すべき」課題と向き合うことができます。
ベイジアンネットワークによる学習項目間の因果関係と概念推定
ベイジアンネットワークは、各学習項目同士の影響を有向グラフで表現し、確率的に「ある概念が理解できているか」を推測します。ここではその構造と概念推定手順を一般読者にも分かりやすく紹介します。
学習項目の因果モデル
ネットワークは次の要素で構成されます。
- ノード:個別の学習概念(例:一次関数の「切片」)
- エッジ:概念間の因果関係(例:一次関数の理解が二次関数の解法に影響)
- 条件付き確率表 (CPT):親ノードの状態が子ノードに与える確率
過去受講者データを教師なし学習で解析し、概念間の依存関係を自動抽出します。
概念推定アルゴリズム
学習者が問題を解くたびにベイジアンネットワークは次の手順で概念確率を更新します。
- 証拠入力:正答・誤答情報を対応ノードへマッピング
- ベイズ推定:事前確率とCPT を組み合わせて事後確率を計算
- 未習得判定:事後確率が設定範囲(一般的に 20〜35%)以下のノードを「未習得」扱い
この手法は単一問題だけでは見えにくい知識ギャップも高精度で捉えることができます。
未習得概念抽出の確率的手法と提示ロジック
未習得概念はベイジアンネットワークから算出された確率を基に判定され、学習者へ適切なタイミングでフィードバックされます。以下では抽出プロセスと表示方法を具体的に示します。
抽出手順
システムは次の流れで概念を選び出します。
- 閾値設定:デフォルトは 20〜35% の範囲で、学習者ごとに微調整可能です。
- 確率順位付け:閾値以下の概念を確率が低い順にリスト化し、優先度を決定します。
- 時間的重み付け:直近の解答ほど重みを大きくし、最新の学習状態を反映させます。
これにより、概念同士の相関も考慮した「本当に弱い」項目が抽出されます。
提示タイミング
抽出された概念は学習者の操作状況に合わせて次の3つの場面で表示されます。
- 解答直後:誤答が検知された場合、対象概念をハイライトし簡易復習リンクを提示。
- セッション終了時:未習得概念一覧と推奨教材(動画・例題)をサマリとして表示。
- 復習モード開始時:過去に「未習得」と判定された概念が再出題対象となり、復習頻度が自動的に上がります。
UI は色分け(例:赤枠)やアイコンで視覚的に強調し、学習者が直感的に認識できるよう配慮しています。
適応学習モデル/レコメンドエンジンによる問題難易度とテーマの最適化
レコメンドエンジンはリアルタイムで算出された理解度スコアを基に、問題の難易度 と 出題テーマ を自動的に調整します。ここではその内部ロジックと実装例を平易に解説します。
難易度調整メカニズム
難易度は以下の要素で決定されます。
- 理解度スコア:0〜100 の数値で表し、過去の正誤と動画視聴履歴を加重平均して算出。
- 標準偏差ベースの帯域:スコアが 70 前後なら「標準難易度」、80 超えると「やや難しい」へシフトします。
- 学習曲線フィードバック:同一概念で連続正答が続くと、次回は難易度を1段階上げます。
この仕組みにより、学習者は常に挑戦的だけど手の届く問題に取り組むことができます。
テーマ推薦ロジック
テーマ選択は未習得概念と長期目標(例:高校入試)を掛け合わせて行います。
- 優先度付与:未習得概念に「高」~「低」の優先度を設定。
- 出題バランス制御:同一テーマの連続出題は最大3回までに抑え、偏りを防止。
- 目標マッピング:受験科目ごとの重要トピック(例:数学Ⅰ の「二次関数」)に重み付けし、全体カリキュラムと合致させます。
結果として、弱点克服だけでなく本番試験で必要なテーマも網羅的に学習できるようになります。
ユーザー行動データからのリアルタイム理解度算出と ChatGPT ベース AI チューターとの連携
解答や動画視聴などの行動情報は「ポイント」へ変換され、指数移動平均で平滑化した上でリアルタイムに理解度スコアが更新されます。さらに 2025 年以降に導入された ChatGPT ベース AI チューター がこのスコアを活用し、対話型学習支援を行います。
行動データの活用フロー
- イベント取得:解答送信・正誤判定・動画開始/終了が即時にログとして記録されます。
- 重み付け計算
- 正答 → +1 ポイント(問題難易度で加重)
- 誤答 → –0.5 ポイント+未習得概念抽出トリガー
- 動画視聴 60 秒超 → +0.3 ポイント(理解促進とみなす)
- スコア更新:前回スコアに加算し、指数移動平均で平滑化。突発的なミスが過度に影響しないよう調整します。
この処理は数ミリ秒で完了し、学習者のリアルタイム理解度を常に最新状態に保ちます。
精度向上と ChatGPT チューター連携
ChatGPT を基盤とした Manabie AIチューター は以下の形で既存システムを補完します。
- 自然言語質問応答:学習者が「この問題の解き方が分からない」と入力すると、ステップバイステップの解説を即座に生成。
- 概念別フィードバック強化:未習得概念が抽出された際、ChatGPT が追加例題や類似問題を自動提案し、学習負荷を分散させます。
- スコア再評価支援:対話履歴も行動データに組み込み、理解度スコアの微調整に利用します。
この連携により、単なる問題配信から「対話型学習」へと拡張され、学習者は自分のペースで深掘りできる環境が提供されます。
参考文献
- 河合塾One AI の出題アルゴリズムと未習得概念抽出の仕組み(2024). app-tatsujin.com. URL: https://app-tatsujin.com/kawaijuku-one-ai-algorithm/
- 河合塾One 独自開発の AI(公式情報). kawaijukuone.co.jp. URL: https://www.kawaijukuone.co.jp/study/detail/id=75
- AI が質問を解決、河合塾が「Manabie AIチューター」を販売(2025). edu.watch.impress.co.jp. URL: https://edu.watch.impress.co.jp/docs/news/2019447.html