通常の表現

通常の表現(regular expression) は、テキスト文字列で、それが、特別な意味をもつキャラクタになります。つぎのものが、特別な意味をもつキャラクタです。

キャラクタ 意味
^ 一致している文字の最初の部分
$ 一致している文字の最後の部分
. 一致しているキャラクタ
\ エスケープキャラクタ。これに続くキャラクタが通常の意味をもっています。たとえば、通常の表現 \.. は、.a.2 、すなわち、ピリオドで始まる任意の他の二つのキャラクタと一致します。
* 前に位置する(複数)キャラクタと一致します。たとえば、ba* は、b, ba, baa等々と一致します。
+ すぐ前に位置する(複数)キャラクタと一致します。たとえば、ba+ は、ba, baa等々と一致します。
[] カレントキャラクタに一致するキャラクタ群を示します。ハイホンは、キャラクタの範囲を示すために使われます。たとえば、[a-zA-Z0-9_]+ は、foo_bar1 と一致しますが、foo$barとは一致しません。^ は、カレントキャラクタが、それに続くキャラクタでない場合、一致を示します。たとえば、[^0-9] は、数字でない任意のキャラクタと一致します。
\w ワードキャラクタと一致([a-z_A-Z0-9]と同じ)
\W ワードでないキャラクタと一致([^a-z_A-Z0-9]と同じ)
\d 数字と一致([0-9]と同じ)
\D 数字でないものと一致([^0-9]と一致)
\s ホワイトスペースと一致([ \t\r\n\f]と一致)