はてなブックマークに追加
Facebookでシェア
Google+でシェア
Twitterでシェア
正規表現超入門
正規表現では、文章を調べるときにいろいろな記号を使います。もちろん、記号の種類や使い方を覚える必要がありますが、もっとも重要なのは文章がどのような組み立てになっているかを見極める、共通点や何らかのパターンを見つけ出すことです。
文章の組み立てを分析する/その 1
 文章には、多かれ少なかれ何らかのパターンや法則が隠れています。たとえば、誰かに何かを頼まれたときの返事に「はい!わかりました!」という表現があります。この表現は、「はーい!わかりました!」や「はーーーーい!わかりました!」など、その場の雰囲気や気分によって長音府(ー)の数が変わることがあります。しかし、「ー」の数がいくつあっても、この文章は次の図のような単純な組み立てです。

図 1文字が入るか入らないかだけの違いの例
文字が入るか入らないかだけの違いの例
文章の組み立てを分析する/その 2
 次に、「私は男性です」「私は女性です」「私は運転手です」というパターンの文章について考えてみます。どれも文章が表す意味は異なりますが、下の図のように文章の組み立ては同じです。

図 2単語だけが違う文章の例
単語だけが違う文章の例
文章の共通点を見つける/その 1
 今度は、意味も文法も全く異なる文章で考えてみましょう。次の図に表した文章は、共通点がまったくないように思えます。しかし、よく見ると先頭と最後が同じです。

図 3意味が異なっていても共通点が見つかる例
意味が異なっていても共通点が見つかる例
文章の共通点を見つける/その 2
 最後に、アルファベットや数字を含む場合を考えてみましょう。次の図で表した文章は、意味も文章の組み立ても異なります。しかし、アルファベットを使っているという点とWindowsという単語が含まれるという点は共通です。
 このように、文章や文字列の中に存在する何らかの法則を見つけ出し、そして、見つけた法則を正規表現のパターンで書き表せばいいだけです。

図 4アルファベットや数字が含まれる文章の例
アルファベットや数字が含まれる文章の例


Copyright(C) 1999-2015 結城圭介(Ver.3.51) All rights reserved