用户工具

站点工具


短文本无法正确检测编码的问题

以二进制数据

b'\xd6\xa7\xb3\xc5\xb2\xc4\xc1\xcf/Code/p_3_1.m' 

为例:

通过对编码进行猜解后,

gbk的结果为 支撑材料/Code/p_3_1.m

big5的结果为 盓傅第蹋/Code/p_3_1.m

从肉眼来看很容易辨别哪个结果是正确的,但是对于计算机程序来说,两组结果都是符合中文编码要求的,因此可能会误报

短文本无法正确检测编码的问题.txt · 最后更改: 2023/07/28 15:38 由 MNBVC项目组