Encode::CN - 基於中國的中文編碼
use Encode qw/encode decode/;
$euc_cn = encode("euc-cn", $utf8); # loads Encode::CN implicitly
$utf8 = decode("euc-cn", $euc_cn); # ditto
此模組實作基於中國的中文字元集編碼。支援的編碼如下。
Canonical Alias Description
--------------------------------------------------------------------
euc-cn /\beuc.*cn$/i EUC (Extended Unix Character)
/\bcn.*euc$/i
/\bGB[-_ ]?2312(?:\D.*$|$)/i (see below)
gb2312-raw The raw (low-bit) GB2312 character map
gb12345-raw Traditional chinese counterpart to
GB2312 (raw)
iso-ir-165 GB2312 + GB6345 + GB8565 + additions
MacChineseSimp GB2312 + Apple Additions
cp936 Code Page 936, also known as GBK
(Extended GuoBiao)
hz 7-bit escaped GB2312 encoding
--------------------------------------------------------------------
若要詳細了解如何使用此模組,請參閱 Encode。
考量到大小問題,GB 18030
(GBK
的延伸) 會在 CPAN 上以 Encode::HanExtra 的名稱分開發行。該模組也包含額外的基於台灣的編碼。
當您在郵件和網頁上看到 charset=gb2312
時,它們實際上是指 euc-cn
編碼。為了解決此問題,gb2312
會別名為 euc-cn
。當您真正需要 gb2312
時,請使用 gb2312-raw
。
ASCII 區域 (0x00-0x7f) 會保留給所有編碼,即使這與 Unicode Consortium 的對應衝突。