Regular Expression

通常の表現

通常の表現(regular expression) は、テキスト文字列で、それが、特別な意味をもつキャラクタになります。つぎのものが、特別な意味をもつキャラクタです。

キャラクタ	意味
`^`	一致している文字の最初の部分
`$`	一致している文字の最後の部分
`.`	一致しているキャラクタ
`\`	エスケープキャラクタ。これに続くキャラクタが通常の意味をもっています。たとえば、通常の表現 `\..` は、`.a`と`.2` 、すなわち、ピリオドで始まる任意の他の二つのキャラクタと一致します。
`*`	前に位置する(複数)キャラクタと一致します。たとえば、`ba*` は、`b`, `ba`, `baa`等々と一致します。
`+`	すぐ前に位置する(複数)キャラクタと一致します。たとえば、`ba+` は、`ba`, `baa`等々と一致します。
`[]`	カレントキャラクタに一致するキャラクタ群を示します。ハイホンは、キャラクタの範囲を示すために使われます。たとえば、`[a-zA-Z0-9_]+` は、`foo_bar1` と一致しますが、`foo$bar`とは一致しません。`^` は、カレントキャラクタが、それに続くキャラクタでない場合、一致を示します。たとえば、`[^0-9]` は、数字でない任意のキャラクタと一致します。
`\w`	ワードキャラクタと一致(`[a-z_A-Z0-9]`と同じ)
`\W`	ワードでないキャラクタと一致(`[^a-z_A-Z0-9]`と同じ)
`\d`	数字と一致(`[0-9]`と同じ)
`\D`	数字でないものと一致(`[^0-9]`と一致)
`\s`	ホワイトスペースと一致(`[ \t\r\n\f]`と一致)