887398 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

鶏が口だけでも飛び立ちます

鶏が口だけでも飛び立ちます

【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! --/--
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

PR

Keyword Search

▼キーワード検索

Profile

Solis

Solis

Calendar

Comments

effelpist@ kilovermek.es effelpist <a href="https://kilovermek.es/…
http://buycialisky.com/@ Re:TinyURLのようなRedirectionの仕組み(06/30) viagra cialis predamdiferencias entre e…
http://viagraiy.com/@ Re:TinyURLのようなRedirectionの仕組み(06/30) cialis viagra ou levita <a href=&qu…
ジャピーノ@ フィリピンペソなど興味無し 日本でビジネスの手腕が発揮できない者は…
KJN@ MagpieRSSでRSSをHTMLに展開する方法を教えてください。 こんにちは! 最近はwordpressを使って、…
とおりすがり@ たしかに・・・。 この会社の社長さんはすばらしいかたです…
どぴゅ@ みんなホントにオナ鑑だけなの? 相互オナって約束だったけど、いざとなる…
お猿@ やっちまったなぁ! http://feti.findeath.net/rue-oo1/ ちょ…
もじゃもじゃ君@ 短小ち○こに興奮しすぎ(ワラ 優子ちゃんたら急に人気無い所で車を停め…
リナ@ 今日は苺ぱんちゅ http://kuri.backblack.net/ps82ouo/ 今…

Recent Posts

Archives

2024.05
2024.04
2024.03
2024.02
2024.01
2023.12
2023.11
2023.10
2023.09
2023.08

Category

Favorite Blog

なんとなあ New! にわとりのあたまさん

遍路と農業とFXの… おばか社長さん
田舎で!情報起業 … 田舎っぽ こと 関根雅泰さん
パンラヤー(妻)は… samo1965さん
アサワ(妻)はフィ… マハルナさん
     さ.ゆ.り.… さゆり1995さん
2008.03.05
XML
カテゴリ:起業

失敗したことを後で生かしたいと思い書いているけれど、本当に頭がぐちゃぐちゃになっていて書きづらい。半年か1年経ってから、冷静に自分を見つめなおした方がいい気がする。
たぶん、こういうこともあるから、すぐには報告できなかったり書けなかったりするんだろう。

会社の倒産と違って、「自主廃業」に近いから残務整理もさほどあるわけではない。
だけど、途中までしかかっていた案件を提供してくれた人や、なかには期待していただいていた人には申し訳ないと思う。


なんのために起業したか?

ということを振り返ってみる。実は世の中の切羽詰まったニーズはない。しかし、近い将来は必ず必要とされ、そろそろ出始めているニーズに対して対応したいという気持ちがあった。

すでに、Googleをはじめとする先端的な企業や研究所は、研究し始めていると思う。またスクレイピングを専門にする会社はなくても、個人でやっている人はところどころ出始めている。

スクレイピングっていうのは、スキー板を磨くという意味もあるんだけれど、Webから情報を取り出して加工することをいう。

Webの情報がデータベースと考えれば、それを活用したい、データを集めたいという要望はインターネットが始まるぐらいのときからあったと思う。しかし、2000年頃までは、インターネットの情報が少ないこと、Web情報を取得するための言語や環境が不十分だったから、あまり発達しなかった。2000年頃からPerlなどを使って始める人が出始めていて、PHP, Pythonなどの言語を使ってやる人が出てきた。

プログラムの微調整が必要なので、JavaやC/C++などはスクレイピングをするための言語しては向かず、Perlなどのスクリプト言語が向いている。そのうち同じことを考える人が出てきて、、ライブラリを書き、そのライブラリが充実してきて開発も楽になった。Rubyを選んだのは、日本人がつくった言語なので日本語の処理に期待が持てたという理由がある。

 

スクレイピングというのは、大学などの研究ではやっても評価されない、普通の企業もそこまでの継続的な需要はない、マイナーな業務であると思う。だから一人でやるには意義があったと思う。

そして、このスクレイピングを応用して自然言語(日常言語)の理解までいけば、Webから情報を抽出した後で文脈を理解して、Webが巨大なデータベースとなる。検索エンジンは単に文字列を使った検索だが、自然言語を使った検索が可能だし、Webのデータを構造的に理解するようになる。

AIとして理解するのは大変だが、その前の段階でスクレイピングを使って文脈の構造を理解できるようになるのではと考えた。つまり、検索エンジンの次の世代となる。

 

だけど、その道は険しかった。

スクレイピングの入り口で止まってしまって、なかなか先へ進むことができないでいる。

少し先へ進むと、「WebのHTML文書から、人間が自然に読み取っているように、スクレイピングで読み取らねばならない」という問題にぶつかる。AIを実現するのは困難だが、その前段階でやれることがいくつかあるはずだ。それを見つけて一つ一つ実現していこう...



その入口は小さくても、大きな成果が待っているように見えたのだが、なかなか厳しいんだな。しかも途中の成果ではなかなか食えないしね。

うまくいけば、Google規模のリターンはあると思うんだけれど、問題は可能性が低いこと。私の頭では1000年経っても、どこまでいけるんだか。数年後にGoogleか類似の企業が実現して、さらに日本は遅れをとっていく。。

結局、夢は大きすぎて、それに耐えきれなかったんだな。


明日から?は、スクレイピングの問題点について考えてみます。






お気に入りの記事を「いいね!」で応援しよう

Last updated  2008.03.05 16:08:11
コメント(0) | コメントを書く



© Rakuten Group, Inc.