ファイルをほか文字コードからUTF8に変換する方法

この記事を書いたチーム:frontier
ファイルをほか文字コードからUTF8に変換する方法 株式会社Smallit 技術ブログ

UTF-8はASCIIコードとの互換性が高くて世界中の多くのソフトウェアが用いています。幅広く普及していることを考えると、UTF-8は世界的にもポビュラーな文字コードだと言える。テキストの文字形式がUTF-8でないとうまく処理されない場合は文字コード変換の必要があるのですが、文字コードの概要と具体的な変換方法などを紹介します。 

文字コードの種類と特徴 

【エンジニア募集中】フルリモート可◎、売上/従業員数9年連続UP、平均残業8時間、有給取得率90%、年休124日以上 etc.  詳細はこちらから>

文字コードの種類はたくさんありますが、よく使われる代表的な文字コードは以下の通り。 

  1. UTF-8(ユーティーエフハチ・ユーティーエフエイト):
    UTF-8は世界中で最も使われている文字コードです。ASCIIコード部分は1バイト、その他の部分は2~6バイトといったように長さが異なります。様々な機器、OSとの互換性がいいのが特徴です。 

  2. Shift_JIS(シフトジス):
    Microsoft社により定められて、ASCIIコードの文字に日本語の文字を加えた物です。1バイト文字も漢字と同じ16ビットにするので、表示された文字数とバイト数が一致するという特徴があります。 

  3. EUC-JP(イーユーシージェイピー):
    主にUNIXOSで使用される日本語文字のエンコーディング方式です。EUCはExtended Unix Codeの略称で、機種依存文字や日本語の文字を含めた多言語表示に対応しています。EUC-JPという名前は、EUCの日本語版であることを表しています。
     
  4. JISコード(ジスコード):
    日本工業規格が定めた文字コードの一つです。おもに日本語の表示に活用される文字コード。日本工業規格(JIS)により定められた7ビット単位の符号化方式で、通常の文字列では表現することができない特殊な文字や機能(制御文字)については、エスケープシーケンスという特殊な文字の並びにより表現しています。 

UTF8に変換する方法紹介 

テキストファイルは保存する時文字コードの設定変更ができますが、もっとも一般的なWindowsのメモ帳を使った方法を紹介します。 

保存する時に「ファイル」メニューの「名前を付けて保存」を選択「名前を付けて保存」のウィンドウの下「エンコード」で「UTF-8」を選択「保存」ボタンをクリック 

まとめ

異なる端末で作成されたファイルを変換して正しく表示されない場合もあるので、使用環境によって良い変換方法をぜひ試してみてください。 

ファイルの文字化けを解消!文字コードを変換して直す方法 

ファイルの文字化けを解消!文字コードを変換して直す方法(2021年6月24日)|BIGLOBEニュース 

【エンジニア募集中】フルリモートも◎(リモート率85.7%)、平均残業8時間、年休124日以上、有給取得率90% etc. 詳細はこちらから>

Smallitのサービス