文字化け


電子メールなどで受信した文章が訳の分からない文字や記号の羅列になった文章の総称。文字化けには文章の一部が読めなくなる場合や文章全体が読めなくなる場合がある。文章の一部が読めなくなる場合の原因は、フランスで使われているアクサンティギュの付いた文字やドイツ語のウムラウトが付いた文字、カッコ付きの数字や株式会社の省略表示、丸付き数字、ローマ数字などは機種に依存したり、地域に限定された文字などで起こる。ただし、ヨーロッパの特殊な文字などはLatin1やEUCという文字コードを使用することが多いため、インターネット用のブラウザやエディタでそのコードを使えば読むことができる。文章全体が読めなくなる場合の原因は、JISコードの本文が添付ファイル用のBase64でエンコードされたり、quoted-printableでエンコードされたり、UNICODEなどで送信された場合などに、日本語を通信で使用する場合には7ビットの「JIS(ISO-2022-JP)」という文字コードを使うよう定められていることで起こることが多い。例えば日本語を一般のワープロで使用されている8ビットのシフトJISで送信した場合、一般的には受信用のメーラーで自動的に変換してくれることも多いが、サーバーによっては、文字化けした情報のまま送信し、文字化けすることがある。また、Microsoft Internet Mailでは、JISに設定しても、条件によってはなぜか8ビットで送信されてまうことがある。このほかまだまだ多くの原因で文字情報が読めなくなることが多くあるので、一般的にはインターネット上の電子メールは、MIMEでシンプルなテキストを使用することがネチケットになっている。このような文字化けした文章をホームページ上のフォームに文字化けしたテキストを入力し「解読」ボタンを押すだけで、元の文章に解読してくれるホームページも登場している。とくに最近では、絵を電子メールで送ったり、ブラウザから何となく送ったメールが多くの人の迷惑になることが多い。とくに添付ファイルを送ったところ、そのデータがウイルスやワームに感染していて、他人に悪気が無くうつしてしまうことも多い。また、文章の最後にHTMLのタグ付きメールが再度付いて送られる場合も文字化けとして扱う人も多い。これは、エディタやブラウザの設定を変更することで解決できる。
この方法を利用して、もし文字化けしたテキストがメールで届いたら、エディタでHTMLのタグをヘッダ部分と改行部分に打ち、Netscape NavigatorかInternetExplorerで呼び出し、「文書の文字コードセット」でいろいろなコードで試してみると、フィットした文字コードを発見できる。日本IBMの企業ポリシーを掲載していた「e-businessとオリンピック」というページは、Webページ制作者が、日本語に対して、FONTタグのface属性で欧文フォントを指定しているため、初期設定にあるフォントの設定で、「ページ指定のフォントを無視して、設定したフォントを使用する」を選択していないと文字化けが起こった。原因は、Windowsユーザーが作るWebページで、日本語が化ける原因1つで、特にFrontPageはデフォルトで欧文フォントを指定するので、よく起こる現象である。