2008/05/15 インターネットの検索でエポックメーキングな出来事は2度しか起こっていない。1994年にジェリー・ヤン氏らが立ち上げたヤフーがインターネットに検索をもたらしたときと、1998年にラリー・ペイジ氏らがグーグルを立ち上げ、Webページの重要度を示す「PageRank」という概念を導入したときだ。検索連動広告の発明もビジネス的には大きなステップだったが、使い勝手の向上というユーザー視点での転回点は2つだけだ。いま、ベンチャー企業の米Powersetが注目を集め、3つ目のイノベーションを起こすかどうかが注目されている。 ネット検索の歴史:数から順位への転換 Powersetが解決しようとしている問題を明確にするために、インターネットの検索エンジンの歴史を少しだけ振り返ってみよう。 グーグルが登場する以前、各検索サイトは、自分たちがいかに多くのWebページをクロールし、検索に対し
あらゆるデータを詰め込んだデータベース「Freebase」。 Wikipediaや音楽サイトの情報などあらゆる情報を取り込んだデータベース。すでに200万トピックスが入力されているとか。 もちろんユーザー自身も入力することができる。そして共有される。 検索も補完検索をしてくれるので、簡単に適切なトピックにたどり着くことができる。しかも、データの母数がクロールではなく手作業なので、かなりフィルターの精度が高い情報が入っている。 さらにはこの情報をAPI公開しているので自分のサービスで使うことも可能(CCライセンスでの配布も)。 これは検索エンジンとしてなかなか新しい可能性を提示してくれるのではないでしょうか(そういえばGoogle Baseはどうなったんだっけ?) » Freebase
前々回の報告でPowersetの話を書きましたが,その追加というか訂正というか,というような話です.実はPowersetはデータベースとしてFreebaseを使っています.ですから正確に言うとPowersetのやっていることは,Powersetのユーザインタフェースを使って自然言語クエリをFreebaseのクエリに変えて,得られた結果を自然言語に直しているだけなのですね.もちろん形態素解析やWordNetなどはあるのですが,私としてはGoogleのパワーは検索エンジンではなくクローリングで集積された膨大なデータとその処理技術にあり,WikipediaのパワーはGUIではなく人手によって集積された膨大なデータにあるのと同様に,もしPowersetにパワーがあるとすれば,それはFreebaseにその源泉があるのだと思います.というわけでFreebaseを調べてみたら,設立者は何とダニエル・ヒリ
かねてから「Googleキラー」と噂されていた米Powersetが9月17日、テストサイト「Powerset Labs」を限定公開した。 Powersetは独自技術とPARC(XEROXパロアルト研究所)からライセンスを受けた技術を組み合わせて、単語やフレーズではなく文章でWebを検索する自然言語検索エンジンを開発している。同社の技術は現行の検索エンジンとは異なり、「Webページのすべての文章を読んで、その意味を抽出し、セマンティックインデックスを構築する」という。 同社はこれまで技術を公開していなかったが、このほどユーザーが同社技術を利用して、フィードバックを提供できるコミュニティーとしてPowerset Labsを立ち上げた。現在は招待制となっており、電子メールアドレスを登録して待つ必要がある。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く