「文字化け」とは?

「文字化け」とは?

なんとなく知ってる方も多いかと思います。
でも、いざ説明しようとすると不安になりませんか?
そんなわけで、今回は「文字化け」についてまとめます。
知ってる方も復習がてら見ていってください。

文字化けとは?

文字コードの不一致や誤変換によって、
意図した文字が正しく表示されない現象。

それが文字化けです。
↓こんな感じのやつです。見たことありませんか?

繝吶せ繝医?繝シ繧ク

これ、本当は「ベストマージ」って書いてるんです。
文字コード、ってやつが原因でヤバい文字列になっているので、
文字コードについても知っておきましょう。

文字コードとは?

文字をコンピュータで扱うための符号化方式。
それが文字コードです。
ざっくり言うと、「ベストマージ」という人間が見て分かる文字列を、
コンピュータが理解できるように表現してあげていて、
どう表現するかのルールが文字コードです。
文字コードにも種類がありまして、
特に有名な文字コードであるUTF-8や、
日本語に特化したShift_JISなんかがあります。

文字化けの例

例①:違う文字コードで表示した
先ほどの例ですね。
UTF-8のルールで書かれた「ベストマージ」を、
Shift_JISのルールで表示すると「繝吶せ繝医?繝シ繧ク」となります。
UTF-8で表示してあげたり、
Shift_JISに変換してShift_JISで表示してあげると
上手く表示できるはずです。

例②:変換に失敗した
UTF-8で書いた文字をShift_JISに変換しようとした時に、
Shift_JISに登録されていない文字を変換しようとして失敗し、
その結果文字化けするというケースです。
はしご高「髙」なんかが無いらしいです。
この場合はShift_JISでの表示はできないので、
諦めて文字列を変えるか、UTF-8で表示しましょう。

まとめ

初見ではビックリしてしまう文字化けですが、
ちゃんと理由があって起こるのが分かると少し面白いですね。
テキストエディタで文字コードをいじってみたりして
文字化けさせて遊んでみるのも良いですね。