內容

名稱

Encode::CN - 基於中國的中文編碼

語法

use Encode qw/encode decode/; 
$euc_cn = encode("euc-cn", $utf8);   # loads Encode::CN implicitly
$utf8   = decode("euc-cn", $euc_cn); # ditto

說明

此模組實作基於中國的中文字元集編碼。支援的編碼如下。

Canonical   Alias		Description
--------------------------------------------------------------------
euc-cn      /\beuc.*cn$/i	EUC (Extended Unix Character)
        /\bcn.*euc$/i
            /\bGB[-_ ]?2312(?:\D.*$|$)/i (see below)
gb2312-raw			The raw (low-bit) GB2312 character map
gb12345-raw			Traditional chinese counterpart to 
              GB2312 (raw)
iso-ir-165			GB2312 + GB6345 + GB8565 + additions
MacChineseSimp                GB2312 + Apple Additions
cp936				Code Page 936, also known as GBK 
              (Extended GuoBiao)
hz				7-bit escaped GB2312 encoding
--------------------------------------------------------------------

若要詳細了解如何使用此模組,請參閱 Encode

注意事項

考量到大小問題,GB 18030 (GBK 的延伸) 會在 CPAN 上以 Encode::HanExtra 的名稱分開發行。該模組也包含額外的基於台灣的編碼。

錯誤

當您在郵件和網頁上看到 charset=gb2312 時,它們實際上是指 euc-cn 編碼。為了解決此問題,gb2312 會別名為 euc-cn。當您真正需要 gb2312 時,請使用 gb2312-raw

ASCII 區域 (0x00-0x7f) 會保留給所有編碼,即使這與 Unicode Consortium 的對應衝突。

請參閱

Encode