编码测试
CSV test files in UTF-8 (no BOM), UTF-8 with BOM, Shift_JIS, and CP932. For mojibake debugging and CSV import testing. Includes Japanese rows.
UTF-8(BOMなし)のCSVテストファイル
utf8.csv / 659 B
UTF-8 BOM付きのCSVテストファイル
utf8-bom.csv / 662 B
Shift_JISのCSVテストファイル
sjis.csv / 514 B
CP932(機種依存文字含む)のCSVテストファイル
cp932.csv / 518 B
字符编码测试的重要性
包含日文等非 ASCII 文本的 CSV 文件常因编码不匹配而出现乱码。例如 Excel 推荐 BOM UTF-8,各工具支持情况不同。
使用这些测试文件验证您的 CSV 导入功能和文本处理库能否正确处理各种编码。
常见编码的主要特征
- UTF-8: 最常见;大多数编程语言的默认编码。
- UTF-8 BOM: 推荐用于在 Excel 中打开日文 CSV。前三个字节为 EF BB BF。
- Shift_JIS: Windows 环境广泛使用;部分字符(如〜、−)可能出问题。
- CP932: Shift_JIS 的扩展版。支持髙、﨑等机种依赖字符。