さて、その困ったことの原因は、
ASCIIは、アメリカでの利用を考えられて作られた。
というより、アメリカでの利用しか考えられていなかったという点である。
当然、ドイツ人が「ウムラウトどうしよう」てな話にはなるわけだ。
■ISO(International Organization for Standardization)0646
ASCIIでは、通貨単位文字も$しかないのだから、
イギリス人は「ポンドをどうしよう」、
日本人は「円をどうしよう」、
などという話になってくる。
(ここでは、「日本語をどうしよう」はちょっとおいておいて)
そうなれば、各言語独自の拡張をしようというのは、自然の成り行きで、1967年に、ISOが「ASCIIを元にした各言語独自の拡張方法についての決まり」を策定した。
「この決まりだけは最低限守って、各言語独自の文字集合を定義してね」
という話だ。
これが、ISO0646である。
アルファベットや数字などの文字は、ASCIIと同じ位置(BCT : Basic Code Table)に置くことで、最低限の互換性を保とうということだ。
そのかわり、各言語独自の文字は、それ以外の位置に定義しなさいと。
さて、ISO0646では、ASCIIの持つ文字数の倍の2枚の表を定義できるとした。
つまり、8×16=128の表を2枚使って定義をして良いよと。
しかし、これは、256文字の定義をして良いということではない。
ASCIIの表で、制御コードが位置していたところには、新しい2枚目の表も空けといてねという話。
具体的には、下図を参照。
イギリス人は「ポンドをどうしよう」、
日本人は「円をどうしよう」、
などという話になってくる。
(ここでは、「日本語をどうしよう」はちょっとおいておいて)
そうなれば、各言語独自の拡張をしようというのは、自然の成り行きで、1967年に、ISOが「ASCIIを元にした各言語独自の拡張方法についての決まり」を策定した。
「この決まりだけは最低限守って、各言語独自の文字集合を定義してね」
という話だ。
これが、ISO0646である。
アルファベットや数字などの文字は、ASCIIと同じ位置(BCT : Basic Code Table)に置くことで、最低限の互換性を保とうということだ。
そのかわり、各言語独自の文字は、それ以外の位置に定義しなさいと。
さて、ISO0646では、ASCIIの持つ文字数の倍の2枚の表を定義できるとした。
つまり、8×16=128の表を2枚使って定義をして良いよと。
しかし、これは、256文字の定義をして良いということではない。
ASCIIの表で、制御コードが位置していたところには、新しい2枚目の表も空けといてねという話。
具体的には、下図を参照。
ISO0646で変更可能な文字
てなわけで、日本でも、ISO0646に則った形で、JIS X 0201 が策定されたのだが・・
<< Prev (ASCIIの話) | Next (JIS X 0201の話) >>
コメント
[…] さて、ところが、困ったことが起きた。 | Next (ISO0646の話) >> […]
[…] ところで、普通の日本語、漢字とかひらがなとかは? << Prev (ISO0646の話) | Next (JIS X 0208の話) >> […]