ylzq
差别
这里会显示出您选择的修订版和当前版本之间的差别。
两侧同时换到之前的修订记录前一修订版后一修订版 | 前一修订版 | ||
ylzq [2023/08/26 22:18] – MNBVC项目组 | ylzq [2024/11/30 21:38] (当前版本) – [工具调研] MNBVC项目组 | ||
---|---|---|---|
行 14: | 行 14: | ||
- [[将所有unicode控制符加入筛选判断]] | - [[将所有unicode控制符加入筛选判断]] | ||
- [[添加基于Python CP936的支持]] | - [[添加基于Python CP936的支持]] | ||
+ | - [[添加给予Python CP950的支持]] | ||
- [[添加基于Python CP960的支持]] | - [[添加基于Python CP960的支持]] | ||
- [[处理文本中故意加入干扰混淆的数据]] | - [[处理文本中故意加入干扰混淆的数据]] | ||
行 26: | 行 27: | ||
===== 乱码分析 ===== | ===== 乱码分析 ===== | ||
- [[GBK 欧元符号的兼容性问题]] | - [[GBK 欧元符号的兼容性问题]] | ||
+ | - [[GBK 乱码合集]] | ||
- [[BIG5 兼容性问题]] | - [[BIG5 兼容性问题]] | ||
- [[短文本无法正确检测编码的问题]] | - [[短文本无法正确检测编码的问题]] | ||
+ | - [[windows-936-2000编码问题]] | ||
+ | - [[锟斤拷的问题]] | ||
+ | - [[GBK和UTF8互转出现的问题]] | ||
+ | - [[单个字节丢失导致的GBK转换编码出错的研究]] | ||
+ | - [[Linux环境下file命令的magic文件的内容解析]] | ||
===== 编码常识 ===== | ===== 编码常识 ===== | ||
- UTF8, | - UTF8, | ||
+ | - [[UTF8字符集范围]] | ||
+ | - [[UNICODE控制符范围]] | ||
+ | - [[CJK中日韩越共用汉字]] | ||
+ | - [[中文标点符号字符集范围]] | ||
+ | - [[CJK符号范围]] | ||
+ | - [[ASCII字符范围]] | ||
+ | ===== 工具调研 ===== | ||
+ | - [[icu]] | ||
+ | - [[CJK中文需求]] | ||
+ | - [[简繁体转换工具]] |
ylzq.1693059537.txt.gz · 最后更改: 2023/08/26 22:18 由 MNBVC项目组