ピクシブ百科事典

文字化け

もじばけ

文字化けとは、譁?ュ励さ繝シ繝峨?逶ク驕慕ュ峨↓繧医j諢丞峙縺励↑縺?。ィ遉コ縺ィ縺ェ繧九%縺ィ縲√≠繧九>縺ッ縺昴?繧医≧縺ォ隕九∴繧狗憾諷九r謖?☆縲
目次[非表示]

概要

ちなみに、概要は「文字コードの相違等により意図しない表示となること、あるいはそのように見える状態を指す。」と記述している。

文字化けの原因

いくつか存在しており、コンピュータ上で文字を利用するために各文字に割り当てられる固有の数値のことを文字コードといい、固有の数値の不適合などが原因となり、意図しない文字が表示されたり、一部表示が乱れることを指す。

発生状況

発生する状況としては以下の場合が存在する

  • 通信状態の問題
    • 通信状態が悪いために一部内容が欠落したりする
    • これにより1バイト表示の文字、たとえばASCIIでも表示がおかしくなる場合が存在する。
  • 文字コードの表示法の違い
    • 文字コードの仕組みなどが異なるため、表示されない、あるいは意図しない表示がされる
    • 半角カタカナなどもこの要因となりやすい。
  • フォントの問題
  • プログラムの問題
    • プログラム上表示できない文字を別の文字、たとえば文字参照で表示したり別の文字で表示するもの

Webページの文字化け

インターネット上では日本語の文字コードとしてShift_JISがよく使われるが、ほかにも複数文字コードは存在し、同じ日本語の文字コードでもEUC-JPISO-2022-JPとの互換性がなく、最近のOSではUnicode( 符号化形式はWindowsではUTF-16、LinuxではUTF-8 )が使われており、基本的にWebページを表示する際にページに設定された文字コードをブラウザ側が判別して表示するが、判別を失敗する、たとえば設定が記述されていなかったり、誤った設定を含むページだと文字化けが発生する場合があり、その場合は文字コードを手動選択することで改善される場合がある。

混合

時折、デバッグが甘い、あるいは広告との兼ね合いにより複数の文字コード、たとえばShift_JISとUTF-8、あるいは外国語コードが混在しているサイトが存在するが、運営仕事しろといいたくなる。

誤解してはいけないこと

文字化けが発生するのは特にUTF-8で2バイト以上で表される文字の問題であり、半角英数などの1バイト領域にある文字、たとえばASCIIなどは文字コードにこの内容を含むことが多いため文字化けすることはない( 半角カナはShift_JISでは1バイトであるが、UTF-8では3バイト領域の文字であることに注意 )ため、データが破損しない限りは超長期間文章を保存するなら半角英数文字のローマ字で残すといいかもしれないが、やり方は簡単で、全文を数値文字参照にすればOK、HTMLソースに書き込んでおけば、Webブラウザでファイルを開くことにより、原文が出てくるが、ただしUTF-8とUTF-16は互換性はないことには注意されたし。

誤解してはいけないこと2 ガラケーの電子メールの文字化け

基本的にひとつの言葉では文字コードはひとつであるため、文字化けは発生しない( 日本国例外過ぎる )のであるが、ガラケーで使われる文字コードは全キャリアShift_JISに統一されており、文字コードを意図的に変更しない限り文字化けすることはありえないのであるが、Shift_JISには変則仕様が存在し、一部の文字がマルチバイト非対応のアプリケーションやシステムでは化ける、という仕様が存在しているため、それ以外で文字化けするとしたら「意図的に文字化けしたように見せている」としか考えられない。

pixiv

ピクシブ百科事典ではエンコード方式がUTF-8なので、基本的に世界のどの言語のOSが接続してもブラウザとフォントが対応してくれれば同じように表示できるようになっているが、仕様により第三水準や第四水準の漢字の一部に該当し、「UnicodeでU+10000以上の文字」が利用できないという状況が発生したことがある。

関連項目

ネットワーク コンピューター パソコン通信
機種依存文字

参照

wikipedia:同項目Shift_JIS
instant tools:文字化けテスター
みんなの知識 ちょっと便利帳:文字列と数値文字参照(文字参照)の変換

pixivに投稿された作品 pixivで「文字化け」のイラストを見る

このタグがついたpixivの作品閲覧データ 総閲覧数: 286476

コメント