短文本无法正确检测编码的问题
以二进制数据
b'\xd6\xa7\xb3\xc5\xb2\xc4\xc1\xcf/Code/p_3_1.m'
为例:
通过对编码进行猜解后,
gbk的结果为 支撑材料/Code/p_3_1.m
big5的结果为 盓傅第蹋/Code/p_3_1.m
从肉眼来看很容易辨别哪个结果是正确的,但是对于计算机程序来说,两组结果都是符合中文编码要求的,因此可能会误报
短文本无法正确检测编码的问题.txt · 最后更改: 2023/07/28 15:38 由 MNBVC项目组