GB18030(5) | FreeBSD File Formats Manual | GB18030(5) |
名称
gb18030 — 中国語テキストのための GB 18030 符号化方法書式
ENCODING | “GB18030” |
解説
GB18030 符号化は 18030-2000、中国語文字の符号化のための RPC 国家規格を実装します。これは古い GB 2312-1980 および GBK 符号化のスーパセットで、 Unicode の Unihan Extension A (拡張 A) を完全に組み入れています。また、全ての Unicode 3.0 コードポイント (コード番号) のコード空間を提供します。GB18030 符号化中のマルチバイト文字は 1 バイト、2 バイトまたは 4 バイト長であり得ます。合計 150 万以上のコード位置があります。
GB 11383-1981 (ASCII) 文字は 0x00 から 0x7F までの範囲で単一バイトで表されます。
中国語文字は 2 バイトまたは 4 バイトのいずれかとして表されます。 2 バイトで表される文字は、範囲 0x81-0xFE のバイトで始まり、範囲 0x40-0x7E あるいは 0x80-0xFE のいずれかで終ります。
4 バイトで表される文字は、範囲 0x81-0xFE のバイトで始まり、 2 バイト目は範囲 0x30-0x39 で、3 バイト目は範囲 0x81-0xFE で、 4 バイト目は範囲 0x30-0x39 を持ちます。
関連項目
euc(5), gb2312(5), gbk(5), utf8(5) Chinese National Standard GB 18030-2000: Information Technology -- Chinese ideograms coded character set for information interchange -- Extension for the basic set, March 2000. The Unicode Standard, Version 3.0, The Unicode Consortium, 2000.規格
GB18030 符号化は GB 18030-2000 と互換性があると思われます。August 10, 2003 | FreeBSD |