Contents
1. Otter.ai の始め方とプラン選択
このセクションで扱うこと
アカウント作成手順と、無料・有料プランの主な違いを把握します。自分の利用シーンに最適なプランを判断できるよう、料金体系と機能上限のポイントを整理しました。
アカウント作成手順
-
公式サイトまたはモバイルアプリへアクセス
https://otter.aiにアクセスし、画面右上の Sign up をクリックします。 -
メールアドレス/Google アカウントで登録
- メールアドレスの場合は名前・パスワードを入力。
-
Google アカウントでサインアップすると、認証が自動的に完了します。
-
プロフィール設定
名前と利用目的(例:ビジネス、学習)を選択すると、初回ログイン時に適切なテンプレートが提示されます。 -
メール認証(必要な場合)
送信された確認メールのリンクをクリックし、アカウントを有効化します。
プラン比較表(2024 年 10 月時点)
| 項目 | 無料プラン(Basic) | 有料プラン(Pro・Business) |
|---|---|---|
| 月間文字起こし時間 | 最大 600 分(※公式サイトで最新情報を確認) | Pro:最大 6,000 分/月、Business:無制限 |
| 保存できる会話数 | 最大 3,000 件 | 無制限 |
| 日本語認識 | ベータ版(機能は限定的) | フルサポート+自動句読点 |
| エクスポート形式 | TXT・PDF | TXT、DOCX、PDF、SRT など多数 |
| カスタム辞書 / スピーカーラベル | 未提供 | 最大 10 個のスピーカーモデル、カスタム辞書あり |
| チーム共有機能 | なし | 複数ユーザーで共同編集・権限管理可能 |
プラン選択の指針
- 頻繁に日本語を扱う、または チームでの共有が必要 な場合は Pro または Business がコストパフォーマンス的に有利です。
- 初めて使う場合は 無料プランで機能感触を確かめた後、利用頻度や必要機能に応じてアップグレードすると無駄がありません。
2. 日本語音声認識の設定と録音・アップロード方法
なぜ日本語設定が重要か
Otter.ai のデフォルト言語は英語です。日本語を正確に文字起こしさせるには、事前に言語設定を変更し、リアルタイム文字起こしや自動句読点のオプションを有効化する必要があります。
日本語認識の有効化手順
- ログイン後、左サイドバーの Settings → Language を開く。
- 「Japanese」にチェックし、Auto Punctuation(自動句読点) と Live Transcription(リアルタイム文字起こし) をオンにする。
- 設定を保存すると、以降の録音・アップロードで日本語モデルが適用されます。
ポイント:プロジェクトごとに言語設定は変更可能です。複数言語が混在する会議では、開始前に対象言語を必ず確認してください。
録音・ファイル取り込みのデバイス別手順
Web アプリ(Chrome 推奨)での操作
- リアルタイム録音
- ダッシュボード左上の Record をクリック。
- ブラウザがマイクアクセスを要求したら「許可」を選択。
-
録音開始と同時に文字起こし結果が右側にリアルタイムで表示されます。
-
ファイルアップロード
- Import ボタンをクリックし、MP3・WAV・M4A などの音声ファイルを選択。
- アップロード完了後、自動的に文字起こしが開始されます(処理時間は音声長さの約 0.5〜1 倍)。
モバイルアプリ(iOS / Android)での操作
- 録音
- アプリを開き、画面下部中央の赤いマイクアイコンをタップ。
-
録音中は波形と文字が同時に表示され、停止後に自動保存されます。
-
インポート
- 「+」メニューから Import from Files または Import from Cloud(Google Drive・Dropbox 等)を選択。
- 対象ファイルを指定するとバックグラウンドで文字起こしが開始され、完了時にプッシュ通知が届きます。
3. 文字起こしの流れと編集テクニック
文字起こしプロセス全体像
Otter.ai は音声データを受信すると以下のステップで処理します。
1. ストリーミング解析:リアルタイムで音素レベルの認識を行い、段階的にテキストを生成。
2. 日本語モデル適用:文脈と助詞・敬語を推定し、句読点や改行位置を自動調整(設定次第)。
3. 最終出力:録音終了またはファイル解析完了後に全文が確定し UI に表示されます。
目安時間:1 分の音声につき約 30 秒〜1 分で文字起こしが完了します(ネットワーク環境とサーバー負荷に依存)。
校正時に注目すべきポイント
| 項目 | 主なチェック内容 |
|---|---|
| 句読点・改行 | 自動句読点が不自然な箇所は手動で修正し、読みやすさを確保。 |
| 同音異義語・敬語 | 「はし」→「橋」「端」などの誤変換は検索置換機能で一括修正すると効率的。 |
| ハイライト & コメント | 重要フレーズにハイライトを付け、コメント欄に補足情報を書き込むことで後工程が楽になる。 |
音声品質改善策(日本語特有の認識ミス削減)
- マイク距離:発話者から約 15〜30 cm に保ち、口元が直接マイクに入らないようにする。
- ノイズ抑制:静かな部屋で録音し、エアコンや風切り音は事前に停止。
- サンプリングレート:44.1 kHz 以上の高品質 WAV または AAC 推奨。
- 話者数と速度:同時発言を避け、1 人あたり 120〜150 語/分程度で話す。
- 方言・アクセント:標準語に近い発音を心がけ、特殊な方言は事前にテキスト化してからアップロード。
4. スピーカー分離、タグ付け、エクスポート&共有
Speaker ID の活用と手動修正
Otter.ai は自動で Speaker ID を割り当てますが、誤認識は避けられません。以下の手順で正確に管理できます。
- テキスト上で誤ったスピーカーネームをクリック → ポップアップから Edit Speaker または Merge Speakers を選択。
- 正しい名前を入力し、必要なら同一人物のエントリを統合する。
精度向上のコツ
- 録音開始前に各話者がマイク位置や持ち方を微調整すると、ピッチ・音量差が生まれ分離精度が上がります。
- 最大 10 人まで対応可能ですが、実務では 5 人以下 に抑えると管理が楽です。
キーワードやトピックのタグ付け方法
- テキスト中で重要語句(例:納期、予算)をドラッグして選択。
- 右クリックメニューから Add Tag を選び、タグ名(例:
#会議_決定事項)を入力。 - タグ一覧はサイドバーに表示され、クリックすると該当箇所へ即座にジャンプします。
ベストプラクティス:プロジェクト単位で統一したタグ命名規則(例:
#PJ名_テーマ)を策定し、チーム全体で共有してください。
エクスポートと安全な共有手順
利用可能な形式
- TXT:軽量テキスト。簡易編集に最適。
- DOCX:Word 形式で見出しや太字を保持。
- PDF:閲覧専用・レイアウト固定。
エクスポート手順
- 完了した会話ページ右上の Export ボタンをクリック。
- 希望形式(TXT/DOCX/PDF)とオプション(
Include Speaker Labels、Add Timestamps)にチェックを入れる。 - Download または Send to Email を選択して取得。
共有方法
- リンク共有:会話右上のメニューから Share Link を生成し、閲覧権限(閲覧のみ・コメント可)を設定。
- チームフォルダー(Business プラン):プロジェクトごとにフォルダーを作成し、メンバー別にアクセス権を付与できるので情報漏洩リスクが低減します。
5. トラブルシューティングとプライバシー・セキュリティ注意点
文字起こしが途中で止まった/精度が低い時の対処法
| 症状 | 主な原因 | 推奨対策 |
|---|---|---|
| 途中停止 | ネットワーク不安定、無料プランのファイルサイズ上限超過(2 GB) | - 有線または高速 Wi‑Fi に切替 - 大容量ファイルは 500 MB 以下に分割して再アップロード |
| 認識精度低下 | 背景ノイズ、マイク感度不足、言語設定未適用 | - 静かな環境で録音し、指向性マイクを使用 - 設定画面で「Language」を日本語に再確認 |
| リアルタイム遅延 | ブラウザリソース不足、CPU 使用率高 | - 不要タブや拡張機能を閉じる - Chrome の最新版へ更新し、ハードウェアアクセラレーションを有効化 |
データ保護とコンプライアンス
- 暗号化:Otter.ai はデータ転送時に TLS(現在は TLS 1.2 以上)で暗号化し、保存時も業界標準の暗号方式で保護しています。ただし、具体的なアルゴリズム(例:AES‑256)の記載は公式資料に明示されていないため、詳細はサービス提供元へ直接お問い合わせください。
- アクセス権管理:Business プランではロールベースの権限(閲覧者・編集者・管理者)を設定可能です。必要最小限の権限付与で内部統制を強化できます。
- 法規制への適合:日本の個人情報保護法(APPI)および欧州 GDPR に準拠したプライバシーポリシーを提供しています。企業利用時は、社内のデータ保持ポリシーと照らし合わせて設定してください。
- データ保持期間:標準では無期限保存ですが、管理コンソールから自動削除ルール(例:90 日)を設定できます。
6. よくある質問(FAQ)
| 質問 | 回答 |
|---|---|
| Q1. 無料プランでも日本語のリアルタイム文字起こしは利用可能ですか? | ベータ版として提供されていますが、認識精度や自動句読点は有料プランに比べて制限があります。まずは無料で試し、必要に応じてアップグレードしてください。 |
| Q2. 外部マイクを接続したデスクトップでもリアルタイム文字起こしできますか? | はい。Windows/macOS 用のデスクトップアプリでは、システムオーディオ入力として外部マイクを選択すればリアルタイムで文字起こしが可能です。 |
| Q3. エクスポートした PDF にパスワード保護は付けられますか? | 現在の Otter.ai のエクスポート機能では直接設定できません。PDF 作成後に Adobe Acrobat 等でパスワードを追加してください。 |
| Q4. 日本語と英語が混在する会議でも文字起こしできますか? | 「Multilingual」モード(有料プラン)を選択すると、発話ごとに言語自動判別し、日本語・英語両方のテキストが生成されます。 |
| Q5. データ削除リクエストはどこから行えますか? | アカウント設定 → Privacy → Delete Data で対象会話を選択し、完全削除できます。削除は即時に反映され、バックアップからも復元できません。 |
まとめ
- アカウント作成→プラン確認→日本語設定の順に進めれば、すぐに文字起こしが開始できます。
- 録音環境とデバイス選択(Web・モバイルどちらでも)を最適化することで、認識精度は 90 % 超に向上します。
- Speaker ID と タグ付け を活用すれば、情報検索やチーム共有が格段に楽になります。
- トラブル時はネットワーク・ファイルサイズ・設定の三点をまず確認し、必要ならプランアップグレードで機能拡張を検討してください。
以上のポイントを実践すれば、Otter.ai を用いた日本語音声文字起こし業務がスムーズかつ高品質に進行します。ぜひ本ガイドを手元に置きながら、日々の会議・インタビュー・学習記録に活用してください。