Powerset


2005年に米国のシリコンバレーで設立されたPowerset社が開発している入力されたキーワードの意味まで理解して情報を検索する自然文ネット検索(Natural Language Search)サービスの名称。GoogleやYahooがキーワード検索であることから、新しい検索時代が到来すると話題になっている。詳細情報はURL(http://www.powerset.com/)で知ることができる。自然文検索は以前から話題になっているが、検索対象の絶対量で満足がいく検索結果が得られなかったことなどから、話題先行していた。ロイターは2007年9月17日に、「Powerset」が2007年9月17日にテスト版を開始したと報告した。技術はシリコンバレーにあるゼロックス(Xerox)社のPARC研究所(PARC research)で開発された自然言語処理技術を採用している。詳細情報はURL(http://uk.reuters.com/article/technologyNews/idUKN1733022620070917)で知ることができる。
自然言語検索の目標は、人工知能でコンピュータが人間の会話を理解できるかということで、それをURL(http://www.powerset.com/)に申し込むことで、誰でも試せるようになっている。Powerset Labsでは、毎週申し込みがあった中から数100人を招待する計画をしている。この実験で、基本的なソフトウェアアルゴリズムを成立させ、2008年には一般サービスを開始する計画である。
VNUnet UKは2007年10月18日に、ほとんど知られていない「Google Labsウィジェット(Google Labs widget)」をUCSD(UCサンディエゴ/UC San Diego)とUCLAからの研究者が、コンピュータの「常識(common sense)」に加えたと報告した。つまりこれは、コンピュータ科学者がシステムをラベル化しながら自動映像による写真で物を特定するのを助け、文脈を使用する能力を加えたことになった。「セマンティック」の世界で、「Google Labsウィジェット(Google Labs widget)」の「Google Sets」が画像検索で利用できることをコンピュータ科学者に承認された。「意味(セマンティック/Semantic)」を理解するコンピュータの世界へ、「Google Sets」で本格的に突入することが可能であることを実証したことになった。
例えば、従来の自動化された物の識別子はイメージをスキャンして、「人」「テニスラケット」「テニスコート」、および「レモン」を特定した場合、新しい後工程文脈チェックは「テニスボール」として「レモン」を再ラベルする。UCサンディエゴのコンピュータ・サイエンス学科Serge Belongie教授は、「私たちは、私たちの論文が外部の意味関係を物体認識の問題にもたらす最初であると思います。」と、言った。
研究者は、外部の文脈上の情報を自動化された物の識別子に提供するのに「Google Sets」を使用することができることを示した。「Google Sets」はわずかいくつかの例から関連する項目か物のリストを発生させることが可能であることを証明した。例えばユーザーが「ジョン」「ポール」、および「ジョージ」をタイプすると、それは単語「リンゴ」「ビートルズ」、および「ジョン・レノン」と返してくる。
同様に、「ネオン」と「アルゴン」をタイプすると、他の高貴なガスのリスト、「ヘリウム」「クリプトン」が発生して、「キセノン」は「ラドン」と返してくる。Belongie教授は、「ある点では、Google Setsは常識のためのプロキシです。」と説明しました。「論文で私たちは、あなたがシステムをラベルする自動映像の精度を改良する文脈上の情報を提供するこの常識を使用することができることを示した。」システムをラベルするイメージは3ステップの過程で、まず第一に、自動化されたシステムは、イメージ分割を使用することでイメージを異なった領域に分ける。「テニス」の例では、イメージ分割として「人」「規則」「ラケット」および「黄色い球」に切り離す。
次に、自動化されたシステムは、ありえそうなラベルの格付けされたリストをそれぞれこれらのイメージ領域に提供する。最終的にシステムは、イメージの中でラベルのすべて異なった可能な組み合わせを処理して、各画像の中でラベルされた物の文脈上の規定を最大にすることによって、文脈の投与量を加える。このステップの間で、システムが「レモン」を「テニスボール」に変えることを助ける文脈の源として「Google Sets」を使用することができた。この場合「意味文脈規制(semantic context constraints)」が、システムは目視により同様の物の間であいまいさを除くことを支援した。これは、リオデジャネイロで開催された第11回IEEE国際会議で2007年10月18日に紹介された。詳細情報はURL(http://www.vnunet.com/vnunet/news/2201451/boffins-give-comptuers-common)で知ることができる。「Google Sets」はURL(http://labs.google.com/sets)、論文はURL(http://www.cs.ucsd.edu/~sjb/iccv2007a.pdf)にある。
ロイターは2008年5月12日に、サンフランシスコにあるPowersetが、Googleなどの確立したWebサーチ・サービスへの挑戦の第一歩として、キーワードの代わりに会話の言い回しを使用してWikipediaが検索できるsemanticツールを公開したと報告した。
Powersetは、2005年に米国のシリコンバレーで設立されたPowerset社が開発している入力されたキーワードの意味まで理解して情報を検索する自然文ネット検索(Natural Language Search)サービスを提供していた。
以前から気にはなっていたのですが、具体的にWikipediaをターゲットにして動き出した。
いよいよ具体的に、Web3.0に向けて動き出し始めました。
ロゴもページ・デザインも変わった。
Powersetの技術は、いつもユーザー見つけたがっている正確な単語をタイプすることが必要であることから解放して、単語と文の意味を関連する概念に分解している。
つまり、ユーザーが捜し求めているかもしれないことにより、近くなる概念的な関係を理解しようとするために単語の先を見て、各文と全体のドキュメントを分析している。
Powersetは、Google、Yahoo、MicrosoftやIAC InterActiveCorpのAsk.comなどのキーワード探索に依存するサービスを一気に追い抜くことを目的にしている。
自然言語句か質問を使用することで、膨大な数の他のWebサイトを捜すのにどう技術を使用できるかを試す目的で、実験的にWikipediaを使用していると言っている。
時間がたつにつれて、Powerset検索技術に適している質疑応答フォームで情報を組織化できる他の高品質なデータサイトとパートナーを組むことを目指している。
Powersetの会社役員は、例が財政的であるか特許ファイリング、CIA FactbookまたはWikipediaで奮い立たせられたクローンを含むかもしれないと言っている。詳細情報はURL(http://uk.reuters.com/article/technologyNews/idUKL1244854220080512?sp=true)または、URL(http://www.jiten.com/index.php?itemid=9736)で知ることができる。