カテゴリ:未分類ネタ話
3/9エントリーのコメント欄で盛り上がったGoogle検索結果について、とりあえずキャプって見ました。
Google検索(2005/03/11 23:50分頃) "プロ市民" の検索結果 約 33,900 件 (キャプチャー画像) "プロ奴隷" の検索結果 約 1,710 件 (キャプチャー画像) 確かにGoogle検索は条件次第で変動があるようで、日付が変わってから再度検索すると数百~数千件単位で数値に変化がありました。 ちなみに下記はASDICさんによる2005年01月30日のエントリーです。 ■プロ市民とプロ奴隷 [気になったことを調べるblog]
僅か40日程度で数値が倍増している・・・今ではもう3万件を超えている筈です。こういったレッテル貼り用語が普及していくことは、嘆かわしいですね。レッテル貼り用語を普及させて喜ぶような行為は、精神年齢の低い人のする事です。どうして真面目な議論をして渡り合おうと思わないのでしょうか。不思議です。 ★Google検索をする上での注意点 Google検索を使用する場合、半角文字と全角文字を混在させた単語で検索すると不正確な検索結果が出てしまいます。これはGoogle側が自動的に単語を区切ってand検索してしまうからです。 Googleで採用されているBasis technology社の形態素解析エンジンにより「プロ市民」は1単語としてみなされますが、「プロ市民」は全角半角の違いから「プロ」「市民」の2単語で検索されています。当然分割して検索しているので、市民とプロさえ含んでいればヒットします。順番が「市民→プロ」でもヒットします。 証拠は検索後どれでもいいのでキャッシュを表示させることで見ることが出来ます。 形態素解析の結果の違いが判断できるでしょう。「これらのキーワードがハイライトされています」で「プロ市民」は「プロ+市民」に分割されてで黄色一色。「プロ市民」は分割後「プロ(黄色)」「市民(青)」に塗られています。 更にフレーズ検索「"プロ市民"」「"プロ市民"」と比較してみた場合、「プロ市民」の時と同様に「プロ+市民」とは分割されずに黄色一色で出てきます。このことからも、「プロ市民」は「"プロ市民"」「"プロ市民"」同様に1フレーズとして認識されており、「プロ市民」が2フレーズと認識されていると言う判断をつけることが出来ます。 上記の結果により、全角で記述する場合はダブルクォーテーションで囲ったフレーズ検索と同様の解析をされていることがわかります。 参考:wakewakaさん、サスケットさん 結論から言うと、3/9エントリーで紹介した検索結果は全角で検索したのでちゃんと1フレーズで検索できており、データ上は問題ないそうです。技術屋のサスケット隊長からのお墨付きですので、大丈夫みたいです。でも複数の単語が組み合わさった場合は順番も大事なので、長めの単語にはなるべくフレーズ検索で臨む事がお勧めになります。 お気に入りの記事を「いいね!」で応援しよう
"プロ市民" の検索結果 約 33,900 件中 1 - 10 件目 (0.05 秒)
"プロ奴隷" の検索結果 約 1,660 件中 1 - 10 件目 (0.71 秒) (2005年03月12日 01時06分23秒)
"プロ奴隷" の検索結果 約 1,650 件中 1 - 10 件目 (0.21 秒)
"プロ市民" の検索結果 約 33,900 件中 1 - 10 件目 (0.14 秒) [Re: テスト]を含めて1:05から5分以内の検索結果です。 少々違う値が出てますね。 (2005年03月12日 01時14分50秒)
検索時に全角半角やダブルクォーテーションはあまり気にしていませんでした。今後は参考にします。
(2005年03月12日 04時42分31秒)
前エントリでの私のコメント、全然意味無かったですね・・・もうちょっと調べてから書き込むべきだったorz
“ ”で囲むということには全く考えが及びませんでした。 ところで半角カナって私は普段使ってないんですが、皆さん普通に使ってらっしゃるのでしょうか? (2005年03月12日 10時47分15秒)
Jの人さん
>皆さん普通に使ってらっしゃるのでしょうか? 半角カナを好んで使うのは厨房だけです。匿名掲示板ならともかく、"表"で乱用していたら品性を疑われます。 (2005年03月12日 12時04分33秒)
■「Googleサジェスト」日本語版が公開に
http://www.itmedia.co.jp/news/articles/0503/09/news050.html >Gooleサジェストは、検索窓に入力中のキーワードに対し、 >想定されるキーワードや絞り込みキーワードを提案(サジェスト)してくれる。 これは面白そうですね。 (2005年03月13日 01時20分32秒) |