読み込み中...
読み込み中...
UTF-8・Shift_JIS・EUC-JP・JISの相互変換。文字化け修正にも。
テキストを指定した文字コードのバイト列に変換します
働き方を見直すなら
関連する選択肢をまとめて確認できます。
※ PRリンクを含みます
文字コード(エンコーディング)とは、コンピュータがテキストを表現するためのルールです。 日本語では主にUTF-8、Shift_JIS、EUC-JP、ISO-2022-JP(JIS)の4種類が使われています。 異なるシステム間でファイルをやり取りする際に文字コードが一致しないと「文字化け」が発生します。 このツールでは文字コードの相互変換・自動検出・バイト列表示に対応し、文字化けの原因調査と修正が行えます。
文字化けした文章を復元したい場合は 文字化け修正、CSVの構造変換まで行う場合は CSV⇔JSON変換、バイナリをテキスト化したい場合は Base64変換 もあわせて確認できます。
| 文字コード | 特徴 | 主な用途 | 日本語1文字 |
|---|---|---|---|
| UTF-8 | 世界標準・多言語対応 | Web・現代システム | 3バイト |
| Shift_JIS | Windows標準だった | CSV・レガシーシステム | 2バイト |
| EUC-JP | Unix/Linux標準だった | 旧Webサーバー | 2バイト |
| ISO-2022-JP | 7bit互換・メール用 | ビジネスメール | 可変 |
テキスト→バイト列
テキストを16進数・10進数のバイト列に変換
バイト列→テキスト
16進数バイト列をテキストにデコード
ファイル変換
テキストファイルの文字コードを一括変換
自動検出
ファイルの文字コードを自動判定
プライバシー保護
すべてブラウザ内で処理。サーバー送信なし
日本語特化
Shift_JIS・EUC-JP・JISなど日本語エンコーディングに完全対応
UTF-8は世界中のすべての文字を扱える可変長エンコーディングで、Webの標準です。Shift_JISは日本語Windows環境で広く使われてきた文字コードで、CSVファイルやレガシーシステムで今も使われています。UTF-8の日本語は1文字3バイト、Shift_JISは2バイトです。
文字化けは、テキストを書いたときの文字コードと、読むときの文字コードが一致しない場合に発生します。例えばUTF-8で保存したファイルをShift_JISとして開くと文字化けします。このツールで正しいエンコーディングを指定してデコードすれば修正できます。
EUC-JPは主にLinux/Unix系の日本語環境で使われてきた文字コードです。かつてのWebサーバーやデータベースで標準的でしたが、現在はUTF-8への移行が進んでいます。レガシーシステムの保守で遭遇することがあります。
ISO-2022-JP(JIS)は日本語メールの標準エンコーディングとして長く使われてきました。RFC 1468で定義されており、7ビットASCIIとの互換性があります。現在もビジネスメールの一部で使用されています。
いいえ、すべての処理はブラウザ上で行われます。ファイルはサーバーにアップロードされず、プライバシーは完全に保護されます。機密性の高いファイルも安心して変換できます。