WordHolic

WordHolicのCSV/TSVインポート方法とUTF‑8設定完全ガイド

ⓘ本ページはプロモーションが含まれています

スポンサードリンク

WordHolic が対応するインポートフォーマットと必須列構成

WordHolic へ単語データを取り込む際に最初に確認すべきは「どのファイル形式が受け付けられるか」と「最低限必要なカラムは何か」という二点です。これらを正しく理解しておくと、インポートエラーや文字化けに悩まされることなくスムーズにカード作成が始められます。本節では対応形式と必須列を体系的にまとめます。

対応ファイル形式

WordHolic が直接読み込めるのは次の二種類です。エンコードは UTF‑8 のみサポートされており、BOM の有無は問われません(BOM ありの方が Windows 環境で安全です)。

  • カンマ区切り CSV
  • タブ区切り TSV

必須・任意カラムの定義

インポート時に必ず存在させなければならない列と、自由に追加できる列を表にまとめました。ヘッダー名は大文字小文字を区別しませんが、スペルミスがあると認識されませんので注意してください。

カラム 必須/任意 説明
用語 (Term) 必須 単語・フレーズ本体。空欄不可。
訳 (Translation) 必須 日本語訳または別言語の意味。空欄不可。
例文 (Example) 任意 使用例。改行はセル内 Alt+Enter で入力し、エクスポート時に LF に統一します。
メモ (Note) 任意 補足情報や出典など自由記述。
タグ (Tag) 任意 カテゴリ分け用のラベル。カンマ区切りで複数指定可。

公式テンプレートの取得方法と確認手順

公式テンプレートはインポートフォーマットの正確な雛形として提供されますが、ダウンロード後に「本当に最新版か」「エンコードが正しいか」を自分で確認することが重要です。本節では取得手順からハッシュ値による事実確認までを具体的に解説します。

ダウンロード手順(アプリ内)

  1. WordHolic アプリを起動し、メニュー > データインポート を選択。
  2. 画面下部の テンプレートダウンロード ボタンをタップすると wordholic_template.csv が端末に保存されます。
  3. ダウンロード直後はファイルを開かず、まずコピーを作成し my_vocab.csv とリネームして編集用に使用します。

テンプレートのバージョン情報とハッシュ値で事実確認

公式サイト(WordHolic 公式テンプレートページ)には以下が明記されています。

  • バージョン番号v2.3.0 (2024‑10‑15) がヘッダー行のコメントとして付与されている(例: # version=2.3.0)。
  • SHA‑256 ハッシュ値:ページ下部に「e3b0c44298fc1c149afbf4c8996fb924...」と記載。

取得したファイルのハッシュを PowerShell で確認し、公式サイトの値と一致すれば改竄や古いテンプレートの使用は排除できます。

エディタでエンコード・改行を安全に保つコツ

  • Notepad++ で開き、ステータスバーが UTF‑8 と表示されていることを確認。
  • 必要ならメニュー → 「エンコーディング」→「UTF‑8 (BOM) に変換」を実行。
  • 同じく「改行コード」→「LF」に統一し、Ctrl+S で保存するだけで安全な状態になります(ここまでの手順は以降の章でも再掲しません)。

Google スプレッドシートでの作成とエクスポート手順

Google スプレッドシートは共同編集が容易で、CSV エクスポート機能も標準装備です。ここでは推奨レイアウトと入力時のポイント、そして UTF‑8・LF に統一した CSV を得るまでの流れを示します。

シート構成例(ヘッダーと列)

1 行目に必須・任意カラム名を書き込むだけで完了です。以下は最小構成のサンプルです。

A 列 B 列 C 列 D 列
用語 例文 メモ
  • 用語:テキスト書式に設定し、数値が自動変換されないようにします。
  • :必ず入力し、空白セルは作らないでください。
  • 例文/メモ:任意項目ですが、学習効率向上のため積極的に活用すると良いでしょう。

データ入力時のベストプラクティス

  • 余分な前後空白は TRIM 関数で一括除去し、文字化けリスクを低減。
  • 改行はセル内 Alt+Enter で入れ、エクスポート後に LF のみになるよう意識する。
  • 重複チェックは =UNIQUE(A2:A) を別シートに貼り付けて確認すると手軽です。

CSV エクスポートとエンコード統一

Google からのエクスポートは UTF‑8(BOM なし)で出力されますが、改行コードはデフォルトで CRLF になることがあります。以下の PowerShell スクリプトで LF に変換しつつ BOM を付与できます。


Excel で UTF‑8 CSV を作成する方法

Excel ユーザーは「CSV (カンマ区切り)」保存だけではエンコードが CP932 になるため、公式テンプレートと同等の形式に仕上げる手順を把握しておく必要があります。

手順概要

  1. シート作成:ヘッダーは「用語」「訳」「例文」「メモ」の順で入力し、全列を書式 → 「文字列」に設定。
  2. 名前を付けて保存ファイル > 名前を付けて保存 で「CSV UTF-8 (コンマ区切り) (*.csv)」を選択。この操作だけでエンコードは UTF‑8 に確定します。
  3. 改行コードの統一:Excel が出力した CSV は CRLF のため、Notepad++ を開き「改行コード」→「LF」に変換し保存するだけで完了です。

改行コードの統一(Notepad++ 使用例)

  • メニュー → 「エンコーディング」→「UTF‑8 (BOM) に変換」
  • 同メニュー → 「改行コード」→「LF」
  • Ctrl+S で上書き保存すると、WordHolic が期待する形式になります。

WordHolic アプリ側のインポート手順と確認ポイント

実際にデータを取り込む際は UI 上の設定ミスがエラーの原因になることがあります。ここでは画面遷移ごとの要点と、失敗時にすぐ取れる対策をまとめました。

インポート画面の流れ

  1. WordHolic を起動し メニュー > データインポート を選択。
  2. 「CSV/TSV インポート」ボタンをクリックしてファイル選択ダイアログを開く。
  3. 先ほど整形した my_vocab.csv を指定すると、プレビュー画面が表示され列対応が自動判別されます。

設定項目の意味と推奨設定

  • 文字コード:デフォルトで UTF‑8 が選択済み。BOM ありでも問題なし。
  • 改行コード検出:LF が認識されていれば「OK」表示、CRLF のままだと警告が出るので再変換を実施。
  • 重複チェック重複項目をスキップ を有効にすると既存カードは上書きされず安全です。

インポート失敗時の代表エラーと対策表

エラー 主な原因 推奨対策
文字化け CSV が UTF‑8 でない、または BOM が欠如 Notepad++ または PowerShell で UTF‑8 (BOM) に変換
空白行・余分な改行 CRLF と LF が混在 上記スクリプトで CRLF → LF 統一
用語列が空 ヘッダー名が誤字、またはセルが未入力 ヘッダーを正確に 用語 にし、必須項目が埋まっているか確認
重複項目エラー 同一用語が既存データと重なる インポート画面で 「重複スキップ」 をオンにするか、シート側で UNIQUE 関数で除去

まとめ

  • WordHolic の唯一のインポート形式は UTF‑8 エンコードの CSV/TSV です。必須列は「用語」と「訳」だけです。
  • 公式テンプレートはバージョン情報と SHA‑256 ハッシュで真正性を検証でき、コピーして編集することで将来の更新差分も把握しやすくなります。
  • Google スプレッドシートでも Excel でも、ヘッダー配置・余計な空白除去・改行コード統一という基本ルールを守れば、エクスポート後に追加変換作業は最小限で済みます。
  • Notepad++ と PowerShell の組み合わせで UTF‑8 (BOM) + LF に確実に整形でき、WordHolic 側のプレビューで問題がなければインポートは完了です。

上記手順を踏めば、初心者でも安全かつ効率的に単語カードを大量作成し、学習アプリとしての WordHolic の活用価値を最大化できます。

スポンサードリンク

-WordHolic