885943 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

鶏が口だけでも飛び立ちます

鶏が口だけでも飛び立ちます

【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! --/--
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

PR

Keyword Search

▼キーワード検索

Profile

Solis

Solis

Calendar

Comments

effelpist@ kilovermek.es effelpist <a href="https://kilovermek.es/…
http://buycialisky.com/@ Re:TinyURLのようなRedirectionの仕組み(06/30) viagra cialis predamdiferencias entre e…
http://viagraiy.com/@ Re:TinyURLのようなRedirectionの仕組み(06/30) cialis viagra ou levita <a href=&qu…
ジャピーノ@ フィリピンペソなど興味無し 日本でビジネスの手腕が発揮できない者は…
KJN@ MagpieRSSでRSSをHTMLに展開する方法を教えてください。 こんにちは! 最近はwordpressを使って、…
とおりすがり@ たしかに・・・。 この会社の社長さんはすばらしいかたです…
どぴゅ@ みんなホントにオナ鑑だけなの? 相互オナって約束だったけど、いざとなる…
お猿@ やっちまったなぁ! http://feti.findeath.net/rue-oo1/ ちょ…
もじゃもじゃ君@ 短小ち○こに興奮しすぎ(ワラ 優子ちゃんたら急に人気無い所で車を停め…
リナ@ 今日は苺ぱんちゅ http://kuri.backblack.net/ps82ouo/ 今…

Recent Posts

Archives

2024.03
2024.02
2024.01
2023.12
2023.11
2023.10
2023.09
2023.08
2023.07
2023.06

Category

Favorite Blog

魔法がとけるかどうか にわとりのあたまさん

遍路と農業とFXの… おばか社長さん
田舎で!情報起業 … 田舎っぽ こと 関根雅泰さん
パンラヤー(妻)は… samo1965さん
アサワ(妻)はフィ… マハルナさん
     さ.ゆ.り.… さゆり1995さん
2008.11.14
XML
カテゴリ:コンピューター
正規表現というものが、コンピューターにはあります。

英語では、Regular Expression というものです。
文字列のパターンマッチングに使われる表記なのですが、前からこの日本語訳がちょっとわかりにくいなと思います。

「通常の表現」や「パターン表現」という方がいいかなと、

正規表現を英語にそのまま訳すと、Normal Expression と言いそうな気がします。
Normal というのは正常や正規のという意味で、正しいというような意味が含まれる気がするからです。


この正規表現どんなときに使われるかというと、
文書の中から特定の言葉を検索するときです。

パソコンでファイルの一覧を表示するときに(最近はあまりやらないのかもしれませんが)、
dir *.doc とすると、*はどんな文字が入ってよくて、最後が.docとなっているファイルの一覧が表示されます。
それをもっと高機能にしたようなものです。

*, ?, [, ^, $, -, \ などの記号をメタ文字といって特別な表現をさせて普通の文字と組み合わせて、任意の(あいまいな)文字列を探すものです。

内容については言語の一種類といってもよく、分厚い本が一冊かけるぐらいですから触れないでおきます。

詳説 正規表現 第3版

こちらのページにわかりやすく書いてあります。

サルにもわかる正規表現入門
http://www.mnet.ne.jp/~nakama/



ところでこの正規表現はとてもすぐれていて、スクレイピングのアセンブリ言語(機械語)といってもいいのです。

スクレイピングでは、Webページの内容を取り込んでそのHTMLを分析します。
そのHTMLを正規表現で検索するのが一番スピードが速いからです。

しかしHTMLの構造(DOM)を解析するわけでは使えないので、アセンブリ言語のようです。


ただ、正規表現には一つ困った性質があります。一致するパターンのなかで最大のものを取り出すという性質です。パターンの中を配列として取り出したり、最初のものを取り出して次のものを取り出したりできるといいなといつも思います。


書いていて、支離滅裂になっていましたが、実は後者のライブラリを作ろうとしていて中途半端になっていたのを思い出しました。最近仕事で正規表現を使うことがあったので、ライブラリを完成させておけばもっと簡単に済んだのにとちょっと残念に思っていました。ノウハウは役立ちましたが。





お気に入りの記事を「いいね!」で応援しよう

Last updated  2008.11.15 11:56:06
コメント(0) | コメントを書く
[コンピューター] カテゴリの最新記事



© Rakuten Group, Inc.