VoiceXML

VXML>>Voice eXtensible Markup Language


XMLをベースとし、音声合成、音声やタッチトーンによる入力、録音、音声対話などの機能をウェブ上で利用するためのマークアップ言語の名称。WWWの標準化団体W3C(World Wide Web Consortium/ワールド・ワイド・ウエーブ・コンソーシアム/ワールドワイド・ウェブ国際コンソーシアム)は2001年9月、W3Cと、AT&T、IBMや、日立製作所、三菱電機などが参加しているVoiceXMLの標準化団体VoiceXMLフォーラムが覚書を交わし、2001年10月23日にバージョン「2.0」のワーキングドラフトを公開した。詳細情報はURL(http://www.w3.org/TR/2001/WD-voicexml20-20011023/)または、URL(http://www.voicexml.org/)で知ることができる。2002年4月24日にW3Cは、VoiceXML 2.0をURL(http://www.w3.org/TR/voicexml20/)で公開した。VoiceXML TutorialはURL(http://www.w3.org/Voice/Guide/)にあり、W3Cの''Voice Browser'' ActivityはURL(http://www.w3.org/Voice/)にある。日立製作所とデンソーは2001年9月から、米国のカーネギー・メロン大学(CMU/Carnegie Mellon University)との共同研究により、ドライバーが、車を運転しながら音声でインターネット等のネットワークにアクセスし、自由に情報を引き出すことができる、次世代車載情報サービス用音声対話システムの開発を進めているが、2002年6月28日にVoiceXMLを活用した次世代車載情報サービス用音声対話システムを開発したことを発表した。詳細情報はURL(http://www.hitachi.co.jp/New/cnews-m/2002/0628/index.html)で知ることができる。W3Cは2003年1月28日に、音声入力時の待受けに利用する音声合成記述言語「SSML(Speech Synthesis Markup Language) 」、想定されるユーザーの応答を記述する文法を指定し、音声認識システムの挙動制御に用いる音声認識文法仕様「SRGS(Speech Recognition Grammar Specification)」、VoiceXMLやその他の対話システムに通話呼出制御機能を提供する呼出制御記述言語「CCXML(Voice Browser Call Control)」や、SRGS における構文や意味を規定する、音声認識における意味解釈「Semantic Interpretation for Speech Recognition」などを含んだ「Speech Interface Framework(音声入出力インタフェース・フレームワーク)」 の基盤を明らかにした「VoiceXML 2.0」の仕様勧告候補を公開した。詳細情報はURL(http://www.w3.org/TR/2003/CR-voicexml20-20030128/)で知ることができる。W3Cは「VoiceXML 2.0」の仕様を勧告案へと進め、業界団体のVoiceXML Forumは2004年2月3日に、「VoiceXML 2.0」を補完する「XHTML+Voice(X+V) Profile 1.2」の仕様を公開した。詳細情報はURL(http://www.voicexml.org/pr20040203.html)または、URL(http://www.voicexml.org/spec.html)で知ることができる。ただし、複数のソフト開発会社は、仕様から多くの特許取得済み技術を除外するという方針を採用しているW3Cが公開準備に入っている「VoiceXML 2.0」は、米国のラトガーズ大学(Rutgers University)が2001年5月29日に取得し、保有する特許権(U.S. Patent No. 6,240,448)「Method and system for audio access to information in a wide area computer network」に抵触する可能性があると指摘している。詳細情報はURL(http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=/netahtml/srchnum.htm&r=1&f=G&l=50&s1=6,240,448.WKU.&OS=PN/6,240,448&RS=PN/6,240,448)で知ることができる。米国のSandCherry社はニューヨーク州ニューヨークで開催されている「SpeechTEK 2004」で2004年9月13日に、VoiceXML(VXML)ブラウザとアプリケーション配信プラットフォームSoftServerに、大手ベンダの音声技術コンポーネントを組み合わせ、カスタマイズされたタッチトーンおよび音声アプリケーションの配信が行えるマルチモーダル・アプリケーション・プラットフォーム「Voice4」を発表した。詳細情報はURL(http://www.sandcherry.com/news.pr.php?news_id=47)で知ることができる。