環境依存文字


■URLエンコードとは

URLエンコードとは、URL/URIのファイル名やクエリ文字列などの一部としては使用できない記号や文字を、 使用できる文字の特殊な組み合わせによって表記する変換規則。 表記できない文字の文字コードを16進数で表したものを「%」に続けて表記し、その文字を置き換える。 半角シャープ「#」は「%23」、半角アスタリスク「*」は「%2A」と表記される。半角スペースは「%20」だが、 例外的に「+」に置き換えてもよい。半角プラス「+」は「%2B」に置き換えられる。 日本語などでは文字コードの種類によって同じ文字でもURLエンコードの表記が異なる。また、この変換はバイト単位で行なうため、2バイト文字の2バイト目が半角アルファベットや数字などに相当する場合は、パーセント表記ではなくその文字を記す。 URLエンコードとは、URLに含むことが禁止されている文字をエンコードすること。URLの上位概念であるURIの規則が定められている、RFC 3986によって規定されており、ラテン文字を中心としたASCIIという文字コード以外の文字を使う場合には、URLエンコードが必要となる。 エンコードされた文字列は、元の文字が半角だった場合「%○○」という文字列を繰り返す形になる。○○の部分には16進コードが入る。元の文字が全角だった場合は「%○○」が2つ分になる。また、半角スペースは「+」に変換される。 URIで使用できる文字 【2014-10-17更新】 URI (ユーアールアイ;Uniform Resource Identifier)またはURL (ユーアールエル;Uniform Resource Locator)で使用できる文字は、RFC 3986外部へのリンクで定められています。RFC 3986は、RFC 1738外部へのリンクとRFC 1808外部へのリンクを統合して更新したRFC 2396外部へのリンクを改定したものです。 予約文字と非予約文字 RFC 3986では、予約文字(Reserved Character)と非予約文字(Unreserved Character)が定められています。 予約文字 区切り文字などの特定目的で用いるために予約されている文字で、その目的以外ではURIに使用できません。 非予約文字 自由にURIに使用できる文字です。 種別 文字 Unicode 文字名 備考 予約文字 ! 0021 感嘆符 RFC2396では非予約文字 # 0023 番号記号、井げた $ 0024 ドル記号 & 0026 アンパサンド ' 0027 アポストロフィ RFC2396では非予約文字 ( 0028 始め小括弧、始め丸括弧 RFC2396では非予約文字 ) 0029 終わり小括弧、終わり丸括弧 RFC2396では非予約文字 * 002A 星印、アステリスク RFC2396では非予約文字 + 002B 正符号、加算記号 , 002C コンマ / 002F 斜線 : 003A コロン ; 003B セミコロン = 003D 等号 ? 003F 疑問符 @ 0040 単価記号、アットマーク [ 005B 始め大括弧、始め角括弧 ] 005D 終わり大括弧、終わり角括弧


機種依存文字とは   外字   機種依存文字と呼ばれる由来   機種依存文字のサンプル   IBMと文字   制御文字   ASCIIコード   unicode   unicodeその他   誤表示   数値参照文字   BOMとは   文字コード表とは   SJIS   EUCJP   NEC特殊文字とは   CP932とは   符号化文字集合とは   メールと文字化け   base64とは   mime形式とは   urlencodeとは   SJISとJISコードの違い   改行とは   空白文字   Base64   ASCII文字←→URLエンコードの対応表   phpでのダブルクォート(シングルクォート) の違い   URLエンコードの気を付けるポイント   デコードの重複の注意ポイント   マルチバイト文字列   htmlエンコーディング   python文字列扱い   php SJIS-WIN   正規表現   正規表現とエスケープ文字   よくつかう正規表現例   メタ文字   波ダッシュ   JWTとは   pythonの文字コード   リモートからsudoを実行   pythonをバージョンを指定して実行   タイムスタンプとは   jsonとは   csvとは   webmとは   円マークとバックスラッシュ問題   ajax cache問題   ajax 非同期・同期通信設定   javaScriptでURLエンコード方法   拡張子一覧