用户工具

站点工具


utf8字符集范围

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录前一修订版
后一修订版
前一修订版
utf8字符集范围 [2023/09/09 21:03] MNBVC项目组utf8字符集范围 [2023/09/11 14:27] (当前版本) MNBVC项目组
行 26: 行 26:
 <code python> <code python>
 import re import re
 +
 ss = "𫟏𫟅𫝆𪜱㐀" ss = "𫟏𫟅𫝆𪜱㐀"
 REGEX_FEATURE_ALL = r'[\U0002a731\u3400\U0002b746\U0002B7C5]' REGEX_FEATURE_ALL = r'[\U0002a731\u3400\U0002b746\U0002B7C5]'
 re_char_check = re.compile(REGEX_FEATURE_ALL, re.IGNORECASE) re_char_check = re.compile(REGEX_FEATURE_ALL, re.IGNORECASE)
 print(re_char_check.findall(ss)) print(re_char_check.findall(ss))
 +
 +
 +ss_2 = "ゐ"
 +REGEX_FEATURE_ALL = r'[\u0800-\u4e00]'
 +re_char_check = re.compile(REGEX_FEATURE_ALL, re.IGNORECASE)
 +print(re_char_check.findall(ss_2))
 +
 +ss_3 = "한국어"
 +REGEX_FEATURE_ALL = r'[\uac00-\ud7ff]'
 +re_char_check = re.compile(REGEX_FEATURE_ALL, re.IGNORECASE)
 +print(re_char_check.findall(ss_3))
 </code> </code>
utf8字符集范围.1694264608.txt.gz · 最后更改: 2023/09/09 21:03 由 MNBVC项目组