codepage就是各国的文字编码和Unicode之间的映射表。系统使用映射表就可以在各种编码中做转换。
查表
以gbk为例,它的codepage=936, 可以从ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP936.TXT下载映射表。
“中”字的映射为
验证
https://www.toolhelper.cn/Encoding/GBK查找“中”字GBK内码为:D6D0
https://www.toolhelper.cn/Encoding/UTF16查找“中”字Unicode内码为:4E2D