環境依存文字


■符号化文字集合とは

符号化文字集合 文字列の集合と1対1で紐付けられたコードの集まり 符号化文字集合 JIS X 0208 日本工業規格(JIS)で定められた、日本語の符号化文字集合 7ビット or 8ビットで表現できる、94(区) x 94(点) の文字の集まり 分類 1〜2区 : 記号 3区 : 数字・ローマ字 4区 : ひらがな 5区 : カタカナ 6〜7区 : ギリシャ・キリル文字 8区 : 罫線 9〜15区 : 未定義 16〜47区 : 第一水準漢字 48〜84区 : 第二水準漢字 85〜94区 : 未定義 文字符号化方式 符号化文字集合をコードに変換する仕組み Shift_JIS ならば以下のリンクに書かれているルールで、JIS X 0208 をコードに変換している → 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。 EUC-JP も、文字符号化方式 Shift_JIS とは別の方法で、JIS X 0208 を符号化している CP932 って Shift_JIS とどう違うの? 符号化方法は一緒 ただし、符号化文字集合が異なる 符号化文字集合の違い 互換性の為に色んな物を詰め込んでいる JIS X 0201 NEC拡張文字 IBM拡張文字 NEC選定IBM拡張文字


機種依存文字とは   外字   機種依存文字と呼ばれる由来   機種依存文字のサンプル   IBMと文字   制御文字   ASCIIコード   unicode   unicodeその他   誤表示   数値参照文字   BOMとは   文字コード表とは   SJIS   EUCJP   NEC特殊文字とは   CP932とは   符号化文字集合とは   メールと文字化け   base64とは   mime形式とは   urlencodeとは   SJISとJISコードの違い   改行とは   空白文字   Base64   ASCII文字←→URLエンコードの対応表   phpでのダブルクォート(シングルクォート) の違い   URLエンコードの気を付けるポイント   デコードの重複の注意ポイント   マルチバイト文字列   htmlエンコーディング   python文字列扱い   php SJIS-WIN   正規表現   正規表現とエスケープ文字   よくつかう正規表現例   メタ文字   波ダッシュ   JWTとは   pythonの文字コード   リモートからsudoを実行   pythonをバージョンを指定して実行   タイムスタンプとは   jsonとは   csvとは   webmとは   円マークとバックスラッシュ問題   ajax cache問題   ajax 非同期・同期通信設定   javaScriptでURLエンコード方法   拡張子一覧