인코딩 테스트
CSV test files in UTF-8 (no BOM), UTF-8 with BOM, Shift_JIS, and CP932. For mojibake debugging and CSV import testing. Includes Japanese rows.
UTF-8(BOMなし)のCSVテストファイル
utf8.csv / 659 B
UTF-8 BOM付きのCSVテストファイル
utf8-bom.csv / 662 B
Shift_JISのCSVテストファイル
sjis.csv / 514 B
CP932(機種依存文字含む)のCSVテストファイル
cp932.csv / 518 B
문자 인코딩 테스트의 중요성
일본어를 포함한 CSV는 인코딩 차이로 문자 깨짐이 자주 발생합니다. Excel에서는 BOM 포함 UTF-8이 권장되는 등 도구마다 대응이 다릅니다.
이러한 테스트 파일로 CSV 임포트 기능과 텍스트 처리 라이브러리가 각 인코딩을 올바르게 처리하는지 검증하세요.
주요 인코딩의 특징
- UTF-8: 가장 일반적. 대부분 프로그래밍 언어의 기본.
- UTF-8 BOM: Excel에서 일본어 CSV를 열 때 권장. 선두에 EF BB BF 3바이트.
- Shift_JIS: Windows 환경에서 널리 사용. 일부 문자(〜, −)에서 문제 발생.
- CP932: Shift_JIS 확장. 髙, 﨑 등 기종 의존 문자 지원.