文字コードテスト
UTF-8(BOMなし)・UTF-8 BOM付き・Shift_JIS・CP932の各文字コードCSVテストファイルを無料ダウンロード。文字化け検証・CSVインポート機能テストに。日本語データ入り。
UTF-8(BOMなし)のCSVテストファイル
utf8.csv / 659 B
UTF-8 BOM付きのCSVテストファイル
utf8-bom.csv / 662 B
Shift_JISのCSVテストファイル
sjis.csv / 514 B
CP932(機種依存文字含む)のCSVテストファイル
cp932.csv / 518 B
文字コードテストの重要性
日本語を含むCSVファイルの処理では、文字コードの違いによる文字化けがよく発生します。特にExcelでの読み込み時にはBOM付きUTF-8が推奨されるなど、ツールごとに対応状況が異なります。
これらのテストファイルを使って、CSVインポート機能やテキスト処理ライブラリが各文字コードを正しく扱えるか検証しましょう。
主な文字コードの特徴
- UTF-8: 最も一般的。多くのプログラミング言語のデフォルト。
- UTF-8 BOM: Excelで日本語CSVを開く場合に推奨。先頭にEF BB BFの3バイトが付く。
- Shift_JIS: Windows環境で広く使用。一部の文字(〜、−など)で問題が生じることがある。
- CP932: Shift_JISの拡張版。髙・﨑・鉤括弧などの機種依存文字に対応。