utf8字符集范围
差别
这里会显示出您选择的修订版和当前版本之间的差别。
两侧同时换到之前的修订记录前一修订版后一修订版 | 前一修订版 | ||
utf8字符集范围 [2023/09/09 20:19] – MNBVC项目组 | utf8字符集范围 [2023/09/11 14:27] (当前版本) – MNBVC项目组 | ||
---|---|---|---|
行 1: | 行 1: | ||
^ unicode范围 ^ 描述 ^ 备注 ^ | ^ unicode范围 ^ 描述 ^ 备注 ^ | ||
- | |||
| U0021-U0080 | | U0021-U0080 | ||
| U4E00-U9FA5 | 最初期统一汉字 | 最初期共20902统一汉字 | | U4E00-U9FA5 | 最初期统一汉字 | 最初期共20902统一汉字 | ||
行 15: | 行 14: | ||
| U9FBC-U9FC2 |统一码5.1汉字 | 7个个汉字 | | | U9FBC-U9FC2 |统一码5.1汉字 | 7个个汉字 | | ||
| UFA70-UFAD9 |北韩的兼容汉字 | 106个汉字 | | | UFA70-UFAD9 |北韩的兼容汉字 | 106个汉字 | | ||
- | | U0800-U4e00 | 日文|| | + | | U0800-U4e00 | 日文|日文| |
- | | UAC00-UD7FF | 韩文|| | + | | UAC00-UD7FF | 韩文|韩文| |
参考来源: | 参考来源: | ||
行 27: | 行 26: | ||
<code python> | <code python> | ||
import re | import re | ||
+ | |||
ss = " | ss = " | ||
REGEX_FEATURE_ALL = r' | REGEX_FEATURE_ALL = r' | ||
re_char_check = re.compile(REGEX_FEATURE_ALL, | re_char_check = re.compile(REGEX_FEATURE_ALL, | ||
print(re_char_check.findall(ss)) | print(re_char_check.findall(ss)) | ||
+ | |||
+ | |||
+ | ss_2 = " | ||
+ | REGEX_FEATURE_ALL = r' | ||
+ | re_char_check = re.compile(REGEX_FEATURE_ALL, | ||
+ | print(re_char_check.findall(ss_2)) | ||
+ | |||
+ | ss_3 = " | ||
+ | REGEX_FEATURE_ALL = r' | ||
+ | re_char_check = re.compile(REGEX_FEATURE_ALL, | ||
+ | print(re_char_check.findall(ss_3)) | ||
</ | </ |
utf8字符集范围.1694261968.txt.gz · 最后更改: 2023/09/09 20:19 由 MNBVC项目组