UNICODE

ユニコード

The Unicode Consortium(ユニコードコンソーシアム)が作成し、IBMやMicrosoft社など、米国の主要コンピュータ企業が万国共通のコードとして、世界各国の文字体系に対応できるようにまとめた、16bitを最小単位として考える文字コード系で、複数の単位で1文字を構成するための合成用文字を含んだ統一文字コードの名称。「UNICODE」に関する団体UNICODE.orgが提供しているUnicode情報はURL(http://www.unicode.org/)で知ることができる。ISO(International Standards Organization/国際標準化機構)では2バイト文字コードを世界標準として、1989年にISO10646で規格化している。1992年にはISOとIECがUNICODEのアーキテクチャを取り入れた文字コード国際規格案第2版を制定し、1993年に採択している。日本ではシフトJISが業界標準になっているがISO10646も採用し、1995年にUNICODEをJIS X 0221としてJIS規格となった。また旧来のJISの延長上として、のJIS X 0213=拡張JISと呼ばれる規格もあるが、この規格はUNICODEとは別である。現在主流の文字コードは、英語圏の文字を1バイト、日本語や中国語の文字を2バイトで表しているため、検索、ソート、index作成時などで文字コードの衝突などの問題を抱えている。そこで、Microsoft社の日本法人が日本の戸籍などの複雑な人名を扱う漢字処理技術として、Windows NTのために開発を始めた。「UNICODE」では、16bitの最小単位2個で1文字を表現するサロゲートペアと呼ばれる機能が規定されたことから、この機構を含む文字エンコーディングスキームに「UTF-16」という固有の名前が与えられた。このような一部の例外を除いて全ての文字を2バイトで表し、扱える漢字数は、JIS X0208-1990の6,355文字、JIS X0212-1990の5,801文字、外字として6,144文字、合計約18,300文字、この他に外国文字10,000文字、未使用コード20,000字分で、シフトJISの約8,600文字に比べ大きく増えるほか、海外と情報のやり取りをしても文字化けのが少なくなる。1991年1月に、ユニコード・コンソーシアムが発足した。「UNICODE」に関しては、International Unicode Conferenceが開催されている。第10回はドイツで開催された。Javaの文字コードにはUNICODEが採用され、日本語の環境が整備されていないためJavaを利用した日本語検索などは構築できない。このマルチメディア事典のWWW版をJavaで構築しようとしたが、残念ながら失敗し、JavaScriptを使ってHTML 3.0のフレームで構築した。IBMはアプリケーション・プログラムをさまざまな国や言語で動作させるため、「UNICODE」に基づいたソフトウェア「IBM Classes for Unicode」のソース・コードを1999年6月18日公開し、無償でアクセスできるようにした。IBM Classes for UnicodeがサポートしているOSは、AIX、Linux、WindowsNT、Solarisである。ダウンロードはURL(http://www.ibm.com/alphaWorks)でできる。ただし、2バイトの「UNICODE」は米国の主要コンピュータ企業が考え出したコードであり、アルファベット26文字とそれに関する特殊なヨーロッパの文字をサポートするという考え方が中心で、すでに2バイト文字では限界を感じている日本、さらに世界で第2位のコンピュータ・ユーザーを抱える中国などの10万とも30万ともいわれている文字をサポートするには「UNICODE」では不可能であり、4バイトまたは、世界中の2,796言語で使われている文字や西夏文字をはじめとする無数にある中国の古代文字、日本の古代文字である神代文字、祈祷文字、沖縄の結縄文字、さらにはプログラミングで使用されるタグやコード、将来解読される可能性のある古代の文字、さらには現状では一切認識されていない、音声では認識できない可能性がある宇宙からのメッセージなど、全ての文字にを完全にコード化することが可能なように、世界共通で8バイトの「Global code」 または「Cosmos code」の開発を視野に入れておく時代なのかもしれない。UNICODEの標準化団体Unicode ConsortiumとWWWの標準化団体W3C(World Wide Web Consortium/ワールド・ワイド・ウエーブ・コンソーシアム/ワールドワイド・ウェブ国際コンソーシアム)は2003年6月13日に、一部のUnicode機能によって、文字コードと、XMLアプリケーションやHTMLブラウザなどのWebマークアップ言語の衝突から、プログラムに障害が起きる可能性があると「Unicode Technical Report #20, Revision 7」と「W3C Note 13-June-2003」で注意を呼びかけた。詳細情報はURL(http://www.oasis-open.org/cover/unicode-xml.html)または、URL(http://www.w3.org/TR/unicode-xml/)または、URL(http://www.w3.org/TR/2003/NOTE-unicode-xml-20030613/)で知ることができる。日本経済団体連合会は 2004年1月20日に、「戦略的な国際標準化の推進に関する提言」を公開した。詳細情報はURL(http://www.keidanren.or.jp/japanese/policy/2004/007.html)で知ることができる。