gbk_乱码合集
差别
这里会显示出您选择的修订版和当前版本之间的差别。
两侧同时换到之前的修订记录前一修订版后一修订版 | 前一修订版 | ||
gbk_乱码合集 [2023/08/31 11:27] – MNBVC项目组 | gbk_乱码合集 [2023/08/31 14:41] (当前版本) – MNBVC项目组 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | 出错文件地址: | + | 出错文件地址: |
- | 报错内容:/ | + | |
+ | 链接: https:// | ||
+ | |||
+ | |||
+ | 报错内容: | ||
调试信息: | 调试信息: | ||
行 10: | 行 14: | ||
</ | </ | ||
- | 初步判断是 -\x80 W -\x9eX\xcb@---P\xcd\xf2\xf0[E这段数据导致的问题 | + | |
+ | 初步判断是字节数据 **-\x80 W -\x9eX\xcb@---P\xcd\xf2\xf0[E** 这段数据\x80 导致的问题 | ||
+ | |||
+ | 测试用的代码: | ||
+ | <code python> | ||
+ | file_path = " | ||
+ | line = True | ||
+ | count = 0 | ||
+ | with open(file_path, | ||
+ | while line: | ||
+ | try: | ||
+ | rl = f.readline() | ||
+ | #line = rl.decode(" | ||
+ | count +=1 | ||
+ | if count == 181: | ||
+ | import pdb; | ||
+ | print(rl) | ||
+ | except Exception as e: | ||
+ | print(e) | ||
+ | |||
+ | </ | ||
+ | |||
+ | |||
+ | 本文档在chrome浏览器中表现也是如此 | ||
+ | {{: | ||
+ | |||
+ | 利用PyIcu可以通过GBK编码格式解码出正确内容,但GB18030会报错 | ||
+ | < | ||
+ | (Pdb) rl | ||
+ | b' | ||
+ | (Pdb) utf8 = UnicodeString(rl, | ||
+ | *** ValueError: ' | ||
+ | (Pdb) utf8 = UnicodeString(rl, | ||
+ | (Pdb) utf8 | ||
+ | < | ||
+ | </ | ||
gbk_乱码合集.1693452463.txt.gz · 最后更改: 2023/08/31 11:27 由 MNBVC项目组