■SJISとは
コンピューターで日本語を表示するために1文字ずつに番号を割り当てた、文字コードのひとつ。 多くのパソコンで標準の日本語用の文字コードとして使われている。 JIS規格で定められたJISコードを改良したもので、JISコードが7ビットで文字を表すのに対して、 シフトJISコードは、すべての文字を2バイト(16ビット)で表す。文字の先頭の8ビットで半角文字か全角文字かを区別できる。 シフト JIS 漢字コードは、 パソコン内部で使用されている文字コードで、 JIS 漢字コード (JIS X0208) を移動 (シフト) させたもの Internet Assigned Numbers Authority(IANA)に登録されている日本語の文字集合を符号化する文字符号化方式で、 マルチバイト文字と1バイト文字を切り替えることなく扱えるようにした形式。 JIS X 0201の英数字記号、カタカナ、JIS X 0208を再配置し、JIS X 0208の漢字、記号などが使え、JIS X 0208の附属書1で規定されている。 Shift-JISとかかれることがあるが、これは間違い。また、以前はx-sjisという表記も行われていた 類似のものにWindows-31JやCP932があるが、これらはShift_JISよりも扱える文字集合が多い文字符号化方式。 「㈱」などのいわゆる機種依存文字を使うためには「Windows-31J」などを指定する。 この文字コードは0x5c(バックスラッシュ、「\」「¥」)を含む文字があるため、問題を起こしやすい Shift_JIS マルチバイト文字は2バイトの固定長で表されます。 半角カタカナは1バイトです。 接頭符号ではありません。マルチバイト文字の1バイト目と2バイト目の範囲が重複します。 マルチバイト文字の2バイト目がASCII文字および半角カタカナと重複します。幸い1バイト目は重複しないので、後述するJISよりは扱うのが容易です。 Microsoftによる独自拡張としてWindows-31J(別名:CP932,SJIS-win)があります。扱える文字が少し増えているようです。 文字種 表現 ASCII文字 [00-7F] 半角カタカナ [A1-DF] マルチバイト文字前半 [81-9F][40-FC] マルチバイト文字後半 [E0-EF][40-FC]