環境依存文字


■メールと文字化け

電子メールの送信過程では「JISコード」が使用されている。  日本語メールシステムは、Shift-JISコードで書いたメール文を送信時にJISコード に変換して送り、 受信側ではJISコードで届いたメール文をShift-JISコードに逆変換して読むようになっています。 メールは、元々テキストしか送れないシステムで、しかも英語圏で生まれたシステムで 英語の使用が前提になっています。7ビット(2進数7桁)のASCII コードが前提となっています。  これでは日本語(2バイト)を含めて英語圏以外の人はメールが使えませんし、 英語圏の人でも画像やワープロなどのファイルを添付することはできません。 MIME(Multipurpose Internet Mail Extension)という仕様。 MIME(マイムと読みます)の仕様を一言で説明すると、あらゆるデータをテキスト(正確にいうと英語圏の人にとってのテキスト)、 7ビットのASCII コードに変換(エンコードといいます)して送信し、受信する側ではそれを 逆変換(デコードといいます)して元のデータに戻して読みます。  これがメールシステムの根本的な考え方で、日本語の本文のみのメールでも この仕様に基づいて送受信が行われます。 JISコードはこのような背景を持って、ASCII に準じて策定された7ビットコード体系になっているので、 メールの送信時の文字コードとして使われます。 日本語メールソフトはShift-JISコードで書いたメール文をJISコードにエンコードして送信するという 処理を行います。受信側ではJISコードで届いたメール文をShift-JISコードにデコードして読みます。 普段よく利用するファイルの添付とは、ファイルをテキスト化(7ビットコード化)する作業です。 この7ビット化の手順を規定したものが base64 という仕様で、受信側では 元のファイルにデコードすることになります。


機種依存文字とは   外字   機種依存文字と呼ばれる由来   機種依存文字のサンプル   IBMと文字   制御文字   ASCIIコード   unicode   unicodeその他   誤表示   数値参照文字   BOMとは   文字コード表とは   SJIS   EUCJP   NEC特殊文字とは   CP932とは   符号化文字集合とは   メールと文字化け   base64とは   mime形式とは   urlencodeとは   SJISとJISコードの違い   改行とは   空白文字   Base64   ASCII文字←→URLエンコードの対応表   phpでのダブルクォート(シングルクォート) の違い   URLエンコードの気を付けるポイント   デコードの重複の注意ポイント   マルチバイト文字列   htmlエンコーディング   python文字列扱い   php SJIS-WIN   正規表現   正規表現とエスケープ文字   よくつかう正規表現例   メタ文字   波ダッシュ   JWTとは   pythonの文字コード   リモートからsudoを実行   pythonをバージョンを指定して実行   タイムスタンプとは   jsonとは   csvとは   webmとは   円マークとバックスラッシュ問題   ajax cache問題   ajax 非同期・同期通信設定   javaScriptでURLエンコード方法   拡張子一覧