環境依存文字


Base64

Base64は、データを64種類の印字可能な英数字のみを用いて、それ以外の文字を扱うことの出来ない通信環境で マルチバイト文字やバイナリデータを扱うためのエンコード方式。 MIMEによって規定されていて、7ビットのデータしか扱うことの出来ない電子メールにて広く利用されている。 具体的には、A–Z, a–z, 0–9 までの62文字と、記号2つ (+, /)、さらにパディング(余った部分を詰める)のための記号として = が用いられる。 この変換によって、データ量は4/3(約133%)になる。 また、MIMEの基準では76文字ごとに改行コードが入る この分の2バイトを計算に入れるとデータ量は約137%となる URLにBase64を含ませると、+ と / が問題を引き起こすことがある これらの文字がURLで特別な意味を持つために %XX の形にエスケープする必要が生じるためである。 他にも、+ と / が特別な意味をもつ個所(正規表現など)やその使用が制限される個所(XMLなど)で Base64を用いるときには、この二文字のかわりに !、-、. 等を用いることがある。

Basic認証

HTTPヘッダでは、特殊記号を使用することが出来ないため、ユーザー名とパスワードをコロン (:) で区切ってBase64エンコードした 文字列がBasic認証に用いられている。 Base64とは、データの変換方式のひとつで、主に電子メールにファイルを添付する際に用いられる方式のこと。 Base64は、MIME (Multipurpose Internet Mail Extensions) 中で定義されている電子メールにファイルを添付する際に 使われるデータの変換方式のひとつで、もっとも普及している方式。 本来、電子メールではテキストデータしか送信できない仕組みになっているために、画像や音声などのファイルを 直接送ることはできませんでした。そこで、これらのファイルも電子メールで送信できるように、 画像や音声などのファイルを英数字に変換し、添付という形で送ることを可能にしたものがBase64。 Base64のほかにも電子メールでファイルの送信を可能にするデータ変換方式が存在し、主なものとしてはuuencode、BinHex、ishといったものがあります。 BASE64とは、バイナリデータを一定の規則に基づいてテキスト(文字)データに置き換える変換方式の一つで、64種類の英数字のみを用いてデータを表現する方式。電子メールの添付ファイル(MIME)などでよく用いられる。 テキスト形式のデータしか受け付けないデータ形式やデータ伝送路などを用いてバイナリ形式のデータを保存・伝送するために用いられるもので、アルファベットの大文字(26文字)と小文字(26文字)、数字(10文字)、「+」「/」の2つの記号を用いてあらゆるデータを表現する。元のデータの置き換えには使わないが、規定の文字数に達しない場合に「=」も使用される。 base64とは、64進数を意味する言葉で、すべてのデータをアルファベット(a~z, A~z)と数字(0~9)、一部の記号(+,/)の64文字で表すエンコード方式です ただ、データ長を揃えるためにパディングとして末尾に記号の=を使用するので、厳密にはbase64は、65文字の英数字から表現されます base64を使うの理由 かつての電子メールを送るためのプロトコルSMTPでは、ASCIIといわれる7byteで表現される英数字しか送ることができませんでした したがって、メールを使って画像や音声などのデータをやりとりしたいと思った時に、英数字しか対応していないSMTPでは、それらのデータを送受信することができませんでした そこで、すべてのデータを英数字で表すMIME(Multipurpose Internet Mail Extensions)という規格が登場し、その中でbase64というデータの変換方法が定められました これによって、受信側と送信側がMIMEに則ってエンコード・デコードをすることで、メールを通して画像や音声などの送受信が可能になりました 現在では、JSONなどで特殊文字を含まないように画像データをbase64でエンコードしたり、Webページの表示の際にリクエスト数を減らすためにbase64でエンコードした画像をhtmlにそのまま埋め込むなどの用途で用いられています


機種依存文字とは   外字   機種依存文字と呼ばれる由来   機種依存文字のサンプル   IBMと文字   制御文字   ASCIIコード   unicode   unicodeその他   誤表示   数値参照文字   BOMとは   文字コード表とは   SJIS   EUCJP   NEC特殊文字とは   CP932とは   符号化文字集合とは   メールと文字化け   base64とは   mime形式とは   urlencodeとは   SJISとJISコードの違い   改行とは   空白文字   Base64   ASCII文字←→URLエンコードの対応表   phpでのダブルクォート(シングルクォート) の違い   URLエンコードの気を付けるポイント   デコードの重複の注意ポイント   マルチバイト文字列   htmlエンコーディング   python文字列扱い   php SJIS-WIN   正規表現   正規表現とエスケープ文字   よくつかう正規表現例   メタ文字   波ダッシュ   JWTとは   pythonの文字コード   リモートからsudoを実行   pythonをバージョンを指定して実行   タイムスタンプとは   jsonとは   csvとは   webmとは   円マークとバックスラッシュ問題   ajax cache問題   ajax 非同期・同期通信設定   javaScriptでURLエンコード方法   拡張子一覧