音声処理


一般には音声認識と音声合成などの総合的な処理ができる機能を持っている総称として使われる。ただし、解説書を熟読すると、ときどきその単一の機能しかないにも係わらず、音声処理機能と表現していることもあるので、注意する必要がある。音声技術の見本市としては、毎年SpeechTEK & Speech Technology Magazineが米国で主催する「スピーチTEK(SpeechTech)」を開催している。詳細情報はURL(http://www.speechtek.com/)で知ることができる。リコーは手離しで会話ができるハンズフリー電話や携帯電話などに使う音声処理用LSI「RC5S860」を開発し、1998年12月にサンプル出荷を開始した。米国では低価格で、インターネット技術と優れたタイピストなどを組み合わせ、法律や医学など専門分野にも対処できる、音声をテキストに変換するiDictate.com社のサービスも登場している。今後は、各企業が各種フォーマットをインターネット上で公開することで、このようなサービスに翻訳を組み合わせ、電話で企画書や報告書などのデータとフォーマット番号、使用言語などを送ると、相手先に合わせたフォーマットと言語に変換してPDFなどで届けてくれるサービスが登場することだろう。詳細情報はURL(http://www.idictate.com/)で知ることができる。また、公式文書のサインや印鑑の代わりに音声認証システムを使用することも可能である。米国のIBMは2004年9月13日に、音声処理関連のソフトウェア部品パッケージ「RDCs(Reusable Dialog Components)」をApache Software Foundationに、VoiceXML用マークアップ エディタをEclipse Foundationに提供すると発表した。 詳細情報はURL(http://www-1.ibm.com/press/PressServletForm.wss?MenuChoice=pressreleases&TemplateName=ShowPressReleaseTemplate&SelectString=t1.docunid=7293&TableName=DataheadApplicationClass&SESSIONKEY=any&WindowTitle=Press+Release&STATUS=publish)または、URL(http://www.apache.org)または、URL(http://www.eclipse.org)で知ることができる。2005年日本国際博覧会協会、ソーシャルサービス協会、日本IBMは2005年3月22日に、2005年日本国際博覧会(愛・地球博)のホームページで、パソコン初心者や高齢者、視力の弱い方などが、容易にホームページを閲覧できるようにするインターネット支援ソリューション「らくらくウェブ散策」を採用し、日・英・仏・中(繁体字、簡体字)・韓・西の7つの言語の読み上げ機能を提供すると発表した。詳細情報はURL(http://www-6.ibm.com/jp/press/20050322001.html)または、URL(http://www.expo2005.or.jp/jp/index.html)または、URL(http://www.expo2005.or.jp/)で知ることができる。