今までは、何やら、「半角の*1英数/記号/カタカナ」といった話であった。
では、「全角のひらがな/カタカナ/漢字」なんかはどーなんてんの?
という話をまとめる。
これは、JIS X 0208 と呼ばれる文字集合/符号化方式である。
- 注1規格として文字の表示幅については言及していない。半角だの全角だのという表現は結果論にしかすぎないので、本当はちょいと不適当な表現
JIS X 0208
JIS X 0208 は1978年に、全角のひらがな/カタカナ/漢字といった文字を扱うための文字集合である。*2
JIS 第1水準漢字と第2水準漢字やひらがな/カタカナ/各種記号やキリル文字(ロシア文字)/ギリシャ文字/罫線素片など6879字を定義したものである。
ASCIIは1面やJIS X 0201 は2面の表として定義されたのに対して、JIS X 0208 では面ではなく「区」という区切りで、文字列を区分しており、その区の中にある文字の位置を「点」という数値で表す。
そのため、JIS X 0208のことを「区点コード」とも呼ぶ。
1978年の策定以後、1983/1990/1997の3回の改訂を経ているが、1983年の改訂が比較的一番大きな改訂であったため、それ以前のもの*3を「旧JIS」、それ以降のもの*4を「新JIS」と呼ぶ。
ちなみに、JIS X 0201 の半角カタカナ部分は、将来的に、削除されるらしい。
JIS X 0208-1997『付属書1(規定) シフト符号化表現』より
JIS X 0201 の片仮名用図形文字集合の割り当ては, この規格の将来の改正では, 削除することを予定している。
JIS X 0201 の片仮名用図形文字集合の割り当ては, この規格の将来の改正では, 削除することを予定している。
だってさ。
<< Prev (JIS X 0201の話) | Next (文字コードの話) >>
コメント
[…] そすれば、ASCII文字との互換性も保てるじゃんかしさぁ〜と。 それが、UTF-8 だよと。 ま、そのくらいしか、私も理解してない。 << Prev (JIS X 0208の話) | Next (参考URL・書籍など) >> […]