■符号化文字集合とは
符号化文字集合 文字列の集合と1対1で紐付けられたコードの集まり 符号化文字集合 JIS X 0208 日本工業規格(JIS)で定められた、日本語の符号化文字集合 7ビット or 8ビットで表現できる、94(区) x 94(点) の文字の集まり 分類 1〜2区 : 記号 3区 : 数字・ローマ字 4区 : ひらがな 5区 : カタカナ 6〜7区 : ギリシャ・キリル文字 8区 : 罫線 9〜15区 : 未定義 16〜47区 : 第一水準漢字 48〜84区 : 第二水準漢字 85〜94区 : 未定義 文字符号化方式 符号化文字集合をコードに変換する仕組み Shift_JIS ならば以下のリンクに書かれているルールで、JIS X 0208 をコードに変換している → 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。 EUC-JP も、文字符号化方式 Shift_JIS とは別の方法で、JIS X 0208 を符号化している CP932 って Shift_JIS とどう違うの? 符号化方法は一緒 ただし、符号化文字集合が異なる 符号化文字集合の違い 互換性の為に色んな物を詰め込んでいる JIS X 0201 NEC拡張文字 IBM拡張文字 NEC選定IBM拡張文字