環境依存文字


正規表現とメタ文字

メタ文字をエスケープする メタ文字は検索や置換の際に特別な意味を持つ記号として扱われますが、時にはメタ文字である文字そのものを検索したいことがあります。 そのような場合は、「ここではメタ文字としてではなく、この文字を検索したい」と宣言する必要があり、そのことを「エスケープする」といいます。 エスケープの方法には、1文字ずつエスケープする方法と、範囲を指定してまとめてエスケープする方法があります。 基本のメタ文字 正規表現には記号(メタ文字)がたくさんありますが、ここでは、基本中の基本といえるメタ文字をいくつかご紹介します。 頻繁に利用するメタ文字なのでぜひ覚えてください。 ※以下、赤字がメタ文字です。 <…または…> 「または」の対象が1文字の場合は、[ ]内にその候補を指定します。 「または」の対象が文字列の場合は、|で区切って指定します。 AまたはB → [AB] 赤または黄または青 → [赤黄青] テレビまたはラジオ → テレビ|ラジオ 大阪または京都または奈良 → 大阪|京都|奈良 <…から…のどれか> 対象が1文字の場合には、候補を-で範囲指定できます。 「0」から「9」のどれか → [0-9] 「あ」から「お」のどれか → [あ-お] <…以外…> 候補や範囲指定の[ ]内に、「^」を記述します。 2、4、6以外 → [^246] 「か」から「こ」以外 → [^か-こ] <文字の繰り返し> 「+」または「*」の前に指定した文字を繰り返すという意味のメタ文字です。 「+」は1回以上の繰り返し、「*」は0回以上の繰り返しを意味します。 任意の1文字を表す「.」と組み合わせて使用する「.+」や「.*」とあわせて、覚えておくと便利です。 0文字以上の任意の文字列 → .* 1文字以上の任意の文字列 → .+ ==============(”=”の連続) → =+ csvファイル(カンマ区切り)内の数字列(nullの場合あり)→ ,[0-9]*,


機種依存文字とは   外字   機種依存文字と呼ばれる由来   機種依存文字のサンプル   IBMと文字   制御文字   ASCIIコード   unicode   unicodeその他   誤表示   数値参照文字   BOMとは   文字コード表とは   SJIS   EUCJP   NEC特殊文字とは   CP932とは   符号化文字集合とは   メールと文字化け   base64とは   mime形式とは   urlencodeとは   SJISとJISコードの違い   改行とは   空白文字   Base64   ASCII文字←→URLエンコードの対応表   phpでのダブルクォート(シングルクォート) の違い   URLエンコードの気を付けるポイント   デコードの重複の注意ポイント   マルチバイト文字列   htmlエンコーディング   python文字列扱い   php SJIS-WIN   正規表現   正規表現とエスケープ文字   よくつかう正規表現例   メタ文字   波ダッシュ   JWTとは   pythonの文字コード   リモートからsudoを実行   pythonをバージョンを指定して実行   タイムスタンプとは   jsonとは   csvとは   webmとは   円マークとバックスラッシュ問題   ajax cache問題   ajax 非同期・同期通信設定   javaScriptでURLエンコード方法   拡張子一覧