環境依存文字


PHPの SJISと SJIS-WINの違い

PHPで文字コード変換を行う場合は、 SJIS指定ではなく、「SJIS-WIN」と文字コードを指定しよう!という話 例) $text= mb_convert_encoding($text, “SJIS-win”, “UTF-8”); $text = mb_convert_encoding($text, “EUC-win”, “UTF-8”); ◆SJIS-WINとは? 「win」が付いているので想像通り、Windows拡張の文字に対応したオプション PHPで文字コードとして「SJIS-WIN」を指定すると、Microsoftが拡張したShift_JISである Windows-31Jが使われる。Windows-31Jは、Microsoftが「JIS X 0208-1990」をベースに、 NECとIBMの独自拡張文字の一部(一般的にはSJISの「機種依存文字」と呼ばれる?)を 取り込んだ文字コード。 ◆SJISとSJIS-WINの違い SJIS-WINの方が文字が多い。 ◆代表例として下記のような文字はSJISーWINにはあるがSJISにはない。 丸数字 (①②③...⑳) ローマ数字 (ⅠⅡⅢ...Ⅹ、ⅰⅱⅲ...ⅹ) カッコ付きの株 (㈱) はしご高[はしごたか] (髙) 川崎[かわさき] (﨑) ◆SJIS-WINにはあるがSJISにはない文字 下記の3種類 NEC 特殊文字(13区) NEC 選定 IBM 拡張文字(89~92区) IBM 拡張文字(115~119区)


機種依存文字とは   外字   機種依存文字と呼ばれる由来   機種依存文字のサンプル   IBMと文字   制御文字   ASCIIコード   unicode   unicodeその他   誤表示   数値参照文字   BOMとは   文字コード表とは   SJIS   EUCJP   NEC特殊文字とは   CP932とは   符号化文字集合とは   メールと文字化け   base64とは   mime形式とは   urlencodeとは   SJISとJISコードの違い   改行とは   空白文字   Base64   ASCII文字←→URLエンコードの対応表   phpでのダブルクォート(シングルクォート) の違い   URLエンコードの気を付けるポイント   デコードの重複の注意ポイント   マルチバイト文字列   htmlエンコーディング   python文字列扱い   php SJIS-WIN   正規表現   正規表現とエスケープ文字   よくつかう正規表現例   メタ文字   波ダッシュ   JWTとは   pythonの文字コード   リモートからsudoを実行   pythonをバージョンを指定して実行   タイムスタンプとは   jsonとは   csvとは   webmとは   円マークとバックスラッシュ問題   ajax cache問題   ajax 非同期・同期通信設定   javaScriptでURLエンコード方法   拡張子一覧