EN JA
GB18030(5)
GB18030(5) FreeBSD File Formats Manual GB18030(5)

名称

gb18030中国語テキストのための GB 18030 符号化方法

書式

ENCODING “GB18030”

解説

GB18030 符号化は 18030-2000、中国語文字の符号化のための RPC 国家規格を実装します。これは古い GB 2312-1980 および GBK 符号化のスーパセットで、 Unicode の Unihan Extension A (拡張 A) を完全に組み入れています。また、全ての Unicode 3.0 コードポイント (コード番号) のコード空間を提供します。

GB18030 符号化中のマルチバイト文字は 1 バイト、2 バイトまたは 4 バイト長であり得ます。合計 150 万以上のコード位置があります。

GB 11383-1981 (ASCII) 文字は 0x00 から 0x7F までの範囲で単一バイトで表されます。

中国語文字は 2 バイトまたは 4 バイトのいずれかとして表されます。 2 バイトで表される文字は、範囲 0x81-0xFE のバイトで始まり、範囲 0x40-0x7E あるいは 0x80-0xFE のいずれかで終ります。

4 バイトで表される文字は、範囲 0x81-0xFE のバイトで始まり、 2 バイト目は範囲 0x30-0x39 で、3 バイト目は範囲 0x81-0xFE で、 4 バイト目は範囲 0x30-0x39 を持ちます。

関連項目

euc(5), gb2312(5), gbk(5), utf8(5) Chinese National Standard GB 18030-2000: Information Technology -- Chinese ideograms coded character set for information interchange -- Extension for the basic set, March 2000. The Unicode Standard, Version 3.0, The Unicode Consortium, 2000.

規格

GB18030 符号化は GB 18030-2000 と互換性があると思われます。
August 10, 2003 FreeBSD