3626275 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

週刊オブイェクトはSeesaaに移転しました。(2005年3月24日)

2005年03月11日
XML
カテゴリ:未分類ネタ話
3/9エントリーのコメント欄で盛り上がったGoogle検索結果について、とりあえずキャプって見ました。


Google検索(2005/03/11 23:50分頃)

"プロ市民" の検索結果 約 33,900 件 (キャプチャー画像
"プロ奴隷" の検索結果 約 1,710 件 (キャプチャー画像


確かにGoogle検索は条件次第で変動があるようで、日付が変わってから再度検索すると数百~数千件単位で数値に変化がありました。


ちなみに下記はASDICさんによる2005年01月30日のエントリーです。


プロ市民とプロ奴隷 [気になったことを調べるblog

プロ市民 の検索結果 約 18,800 件

プロ奴隷 の検索結果 約 2,460 件


僅か40日程度で数値が倍増している・・・今ではもう3万件を超えている筈です。こういったレッテル貼り用語が普及していくことは、嘆かわしいですね。レッテル貼り用語を普及させて喜ぶような行為は、精神年齢の低い人のする事です。どうして真面目な議論をして渡り合おうと思わないのでしょうか。不思議です。



Google検索をする上での注意点
 Google検索を使用する場合、半角文字と全角文字を混在させた単語で検索すると不正確な検索結果が出てしまいます。これはGoogle側が自動的に単語を区切ってand検索してしまうからです。

 Googleで採用されているBasis technology社の形態素解析エンジンにより「プロ市民」は1単語としてみなされますが、「プロ市民」は全角半角の違いから「プロ」「市民」の2単語で検索されています。当然分割して検索しているので、市民とプロさえ含んでいればヒットします。順番が「市民→プロ」でもヒットします。

 証拠は検索後どれでもいいのでキャッシュを表示させることで見ることが出来ます。
形態素解析の結果の違いが判断できるでしょう。「これらのキーワードがハイライトされています」で「プロ市民」は「プロ+市民」に分割されてで黄色一色。「プロ市民」は分割後「プロ(黄色)」「市民(青)」に塗られています。

 更にフレーズ検索「"プロ市民"」「"プロ市民"」と比較してみた場合、「プロ市民」の時と同様に「プロ+市民」とは分割されずに黄色一色で出てきます。このことからも、「プロ市民」は「"プロ市民"」「"プロ市民"」同様に1フレーズとして認識されており、「プロ市民」が2フレーズと認識されていると言う判断をつけることが出来ます。

 上記の結果により、全角で記述する場合はダブルクォーテーションで囲ったフレーズ検索と同様の解析をされていることがわかります。

参考:wakewakaさん、サスケットさん





結論から言うと、3/9エントリーで紹介した検索結果は全角で検索したのでちゃんと1フレーズで検索できており、データ上は問題ないそうです。技術屋のサスケット隊長からのお墨付きですので、大丈夫みたいです。でも複数の単語が組み合わさった場合は順番も大事なので、長めの単語にはなるべくフレーズ検索で臨む事がお勧めになります。






 Read Me やる気の無いサイトリング 時間ねぇー ニンニン






Last updated  2005年03月12日 02時14分26秒
コメント(6) | コメントを書く



© Rakuten Group, Inc.