セマンティックWeb

semantic Web

意味ウェブ>>セマンティック・ウェブ

セマンティック(semantic)とは、言語学的にいう意味論のことで、インターネット上のWebにある情報に、著者や作成日時を始めとした形式属性を規定し、意味論的な構造を持たせ、検索のときに意味を解釈して抽出できるようにする、コンピュータがさらに多様なデータをより容易に検索・加工できるようにするための発展的なプロセスとしてとらえ、次世代インターネットとして期待されている機能の俗称。この技術を検索エンジンに応用すれば、知りたい情報により早くたどり着くことが可能になる。また、意味論的分析エンジンを備えて情報を分類する技術も盛んに研究されている。Web技術の先駆者の一人として知られるTim Berners-Leeは2002年8月11日までコロラドで開催されたテルライド・テック・フェスティバル(Telluride Tech Festival)で、次世代のインターネットとして「セマンティックWeb」について語り、大きな話題になった。詳細情報はURL(http://www.w3.org/People/Berners-Lee/)または、URL(http://www.tekfest.com)で知ることができる。すでにフランスが稼働しているフレンシュロンには、意味論的分析エンジンを備えていると伝えられている。テクノロジー・レビュ(Technology Review)誌の主催で、2004年9月29日〜30日にマサチューセッツ工科大学(MIT)で開催された「未来技術会議(The Emerging Technologies Conference Showcase)」で、ティム・バーナーズ=リー(Tim Berners-Lee)は2004年9月29日に基調講演を行い、「セマンティックWeb」について語り、同時にウェブ開発の前進を妨げる障害には、技術的な側面と、社会的な側面もある。コンピュータ業界は、使用料を要求することで重要な技術を囲い込みたいという衝動を排除しなければならないと、語った。つまり、金の亡者や社会的権力願望者の横暴な行為は、排除すべきということになる。詳細情報はURL(http://www.tretc.com/agenda.htm)で知ることができる。CERN(European Organization for Nuclear Research/欧州合同原子核研究機関)在籍中の1989年にWWWの構想から、URL、HTTP、HTMLなど、WWWの基本となるプロトコルを創った。ティム・バーナーズ・リーは2004年12月2日に、イギリス南部にあるサウサンプトン大学(Universitu os Southampton)の教授に就任し、NGIといわれるセマンティックWebの研究を行うことになったと報告した。詳細情報はURL(http://www.soton.ac.uk/)で知ることができる。SNS(Social Networking Serviceソーシャル・ネットワーキング・サービス)として世間ではユーザーが増えているが、New Scientistは2006年6月9日に、「Pentagon sets its sights on social networking websites」を公開し、あなたがMySpaceやFriendsterなどのソーシャル・ネットワークウェブサイトを使用している何100万人もの人々のひとりであるなら、自分に関して何を明らかにするかに注意してくださいと警告した。米国のNSA(The US National Security Agency米国国家安全保障局)は、人々がそのようなネットワークに自分たちに関して掲示する情報を取り入れ、インターネット技術でそのはデータを銀行業や、小売や特性の記録などの個人的な詳細に結合し、個人のプロフィールを造る方法を研究していると報告している。つまり、MySpaceは同時に、SpySpaceということである。PGPのセキュリティ担当最高責任者Jon Callasは、「私は、人々が自分たちに関して自発的にオンラインで掲示する詳細で絶えず、ショックを与えて、驚かせました。」といい、New Scientistは、雨垂れとコードを壊すことが専門の米国国防総省国家安全保障局は、人々がソーシャル・ネットワークに自分たちに関して掲示する情報の大規模な収穫の研究に資金を供給していることを発見した。そして、ソーシャル・ネットワークウェブサイトからのデータを銀行業や、小売や特性の記録などの詳細に結合する明確にWWWの標準化団体W3C(World Wide Web Consortium/ワールド・ワイド・ウエーブ・コンソーシアム/ワールドワイド・ウェブ国際コンソーシアム)によって標準化された。今度の「semantic web(意味ウェブ)」というインターネット技術でさらに進化させて利用するかもしれない。NSAが個人の大規模で、すべてを包括した個人プロフィールを造るのを許容している。詳細情報はURLhttp://www.newscientist.com/article/mg19025556.200?DCMP=NLC-nletter&nsref=mg19025556.200)で知ることができる。VNUnet UKは2007年10月18日に、ほとんど知られていない「Google Labsウィジェット(Google Labs widget)」をUCSD(UCサンディエゴ/UC San Diego)とUCLAからの研究者が、コンピュータの「常識(common sense)」に加えたと報告した。つまりこれは、コンピュータ科学者がシステムをラベル化しながら自動映像による写真で物を特定するのを助け、文脈を使用する能力を加えたことになった。「セマンティック」の世界で、「Google Labsウィジェット(Google Labs widget)」の「Google Sets」が画像検索で利用できることをコンピュータ科学者に承認された。「意味(セマンティック/Semantic)」を理解するコンピュータの世界へ、「Google Sets」で本格的に突入することが可能であることを実証したことになった。例えば、従来の自動化された物の識別子はイメージをスキャンして、「人」「テニスラケット」「テニスコート」、および「レモン」を特定した場合、新しい後工程文脈チェックは「テニスボール」として「レモン」を再ラベルする。UCサンディエゴのコンピュータ・サイエンス学科Serge Belongie教授は、「私たちは、私たちの論文が外部の意味関係を物体認識の問題にもたらす最初であると思います。」と、言った。研究者は、外部の文脈上の情報を自動化された物の識別子に提供するのに「Google Sets」を使用することができることを示した。「Google Sets」はわずかいくつかの例から関連する項目か物のリストを発生させることが可能であることを証明した。例えばユーザーが「ジョン」「ポール」、および「ジョージ」をタイプすると、それは単語「リンゴ」「ビートルズ」、および「ジョン・レノン」と返してくる。同様に、「ネオン」と「アルゴン」をタイプすると、他の高貴なガスのリスト、「ヘリウム」「クリプトン」が発生して、「キセノン」は「ラドン」と返してくる。Belongie教授は、「ある点では、Google Setsは常識のためのプロキシです。」と説明しました。「論文で私たちは、あなたがシステムをラベルする自動映像の精度を改良する文脈上の情報を提供するこの常識を使用することができることを示した。」システムをラベルするイメージは3ステップの過程で、まず第一に、自動化されたシステムは、イメージ分割を使用することでイメージを異なった領域に分ける。「テニス」の例では、イメージ分割として「人」「規則」「ラケット」および「黄色い球」に切り離す。次に、自動化されたシステムは、ありえそうなラベルの格付けされたリストをそれぞれこれらのイメージ領域に提供する。最終的にシステムは、イメージの中でラベルのすべて異なった可能な組み合わせを処理して、各画像の中でラベルされた物の文脈上の規定を最大にすることによって、文脈の投与量を加える。このステップの間で、システムが「レモン」を「テニスボール」に変えることを助ける文脈の源として「Google Sets」を使用することができた。この場合「意味文脈規制(semantic context constraints)」が、システムは目視により同様の物の間であいまいさを除くことを支援した。これは、リオデジャネイロで開催された第11回IEEE国際会議で2007年10月18日に紹介された。詳細情報はURL(http://www.vnunet.com/vnunet/news/2201451/boffins-give-comptuers-common)で知ることができる。「Google Sets」はURL(http://labs.google.com/sets)、論文はURL(http://www.cs.ucsd.edu/~sjb/iccv2007a.pdf)にある。