ピクシブ百科事典

文字化け

もじばけ

文字化けとは、譁・ュ怜喧縺代→縺ッ縲∵枚蟄励さ繝シ繝峨・驕輔>縺ェ縺ゥ縺ァ豁」縺励¥譁・ュ励′陦ィ遉コ縺輔l縺ェ縺・樟雎。縺ョ縺薙→縺ァ縺ゅk縲である。
目次[非表示]

早い話、こういうことである。

  • ・躍+撝0・・}芭灯遏慧Cワカ>€オヌM・GfサYス^N曚麈C v徐・テVlCi)ヨK・惚ラテ絎・-ュ・L1隆モ゚晥L・・タ駈モEumメgァvョタ"稠ートシC2ヌヨャ・・9ソ繝+・]1ニ3オL・・!XR゙eЕ iヲ゚ゥb゙ィゥ被)坿゙繕ヘァ"ホ・_盡rメ猤・ヨ捌ハワ鴎涯Vン\N・B€\レサニ・ソw_池・忍€ ・ァI・
  • 悚櫢フ・゚ネc8o蟠凬・」>゙シMC敢h・I墲ホン腮+A・レ广Y&ゥンヤ渹メェ:貊Lリヘアロ?8T膵・ラネJ-hハサ?悦ョ杖ケ\ク・U`)ヨ#@・イチ・c・・l優ト2Iゥ掛挌€/ル・€饗同QBロ6リワ7&<БDSOKtーJ・ヘチ盈l 叢Z\]ウ'キu翹サNP・IK}(vー濃zノZy罧X・B・fァR1<限或鋳カ1・愆m玄d\欄・ア・箙キ[癇現゙ウ€モクワ2ョ・

文字化けの原因

コンピュータ上で文字を利用するために各文字に割り当てられる固有の数値のことを文字コードといい、固有の数値の不適合が原因で文字化けが発生する。

日本語の文字コードとしてShift_JISがよく使われるが、
同じ日本語の文字コードでもEUC-JPとISO-2022-JPとの互換性はない。
最近のOSではUnicode(符号化形式はWindowsではUTF-16、LinuxではUTF-8)が使われている。

Webページの文字化け

pixiv百科事典ではエンコード方式がUTF-8なので、世界のどの言語のOSが接続してもブラウザとフォントが対応してくれれば同じように表示できるようになっている。
Webページを表示する際にページに設定された文字コードをブラウザ側が判別して表示してくれるが、設定が記述されていないページだと文字化けが発生する場合がある。
その場合は文字コードを手動選択することで改善される。

時折、デバッグが甘くShift_JISとUTF-8が混在しているサイトをよく見かける。運営仕事しろ

誤解してはいけないこと

文字化けが発生するのはUTF-8で2バイト以上で表される文字の問題であり、半角英数などの1バイト領域にある文字(ASCII)は文字化けすることはない。なお、半角カナはUTF-8では3バイト領域の文字であることに注意。
つまり、半角英文字は文字化けすることはないので超長期間文章を保存するなら
半角英数文字のローマ字で残すといいかもしれない。

やり方は簡単で、全文を数値文字参照にすればOK。
HTMLソースに書き込んでおけば、Webブラウザでファイルを開くことにより、原文が出てくる。

誤解してはいけないこと2 ガラケーの電子メールの文字化け

同じ国同士の言語で文字化けすることはまずありえない。
文字化けするとしたら「意図的に文字化けしたように見せている」としか考えられない。
ガラケーで使われる文字コードは全キャリアShift_JISに統一しているので文字コードを意図的に変更しない限り文字化けすることはありえないのである。
そもそも変更できるのかが疑問である。

pixivに投稿された作品 pixivで「文字化け」のイラストを見る

このタグがついたpixivの作品閲覧データ 総閲覧数: 227065

コメント