用户工具

站点工具


hashlist

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录前一修订版
后一修订版
前一修订版
hashlist [2026/02/03 11:20] – [P2_E02] MNBVC项目组hashlist [2026/04/07 12:00] (当前版本) – 20260407 更新 MNBVC项目组
行 7: 行 7:
   20250813 更新P1_E01内4组数据包   20250813 更新P1_E01内4组数据包
   20251010 累计更新P1_E01内11组数据包   20251010 累计更新P1_E01内11组数据包
-  20251014 新增20250624数据包 +  20251014 新增1组数据包 
-  20251104 更新20230114数据包 +  20251104 更新1组数据包 
-  20251108 更新20250102数据包 +  20251108 更新1组数据包 
-  20251127 新增9组数据包 20250625~20250633 +  20251127 新增9组数据包 
-  20260104 新增20250634+  20260104 新增1组数据包 
 +  20260202 更新1组数据包 新增8组数据包 新增202601目录 
 +  20260310 更新2组数据包 新增1组数据包 
 +  20260323 更新1组数据包 
 +  20260407 更新1组数据包 新增3组数据包
  
 ===== 超大规模中文语料集 Part1 ===== ===== 超大规模中文语料集 Part1 =====
 共计:954个文件 9.73TB 共计:954个文件 9.73TB
 ==== P1_E01 ==== ==== P1_E01 ====
- [[MNBVC_P1_E01|MNBVC P1 E01 HASH FILE]] 含目录:202212、202301 共计:100个文件 949 GB + [[MNBVC_P1_E01|MNBVC P1 E01 HASH FILE]] 含目录:202212、202301 共计:100个文件 953 GB 
 ==== P1_E02 ==== ==== P1_E02 ====
  [[MNBVC_P1_E02|MNBVC P1 E02 HASH FILE]] 含目录:202302、202303 共计:157个文件 1.02 TB  [[MNBVC_P1_E02|MNBVC P1 E02 HASH FILE]] 含目录:202302、202303 共计:157个文件 1.02 TB
行 35: 行 39:
  
 ===== 超大规模中文语料集 Part2 ===== ===== 超大规模中文语料集 Part2 =====
-共计:138个文件 2.39 TB+共计:151个文件 2.56 TB
 ==== P2_E01 ==== ==== P2_E01 ====
  [[MNBVC_P2_E01|MNBVC P2 E01 HASH FILE]] 含目录:202504 共计:99个文件 1.56 TB   [[MNBVC_P2_E01|MNBVC P2 E01 HASH FILE]] 含目录:202504 共计:99个文件 1.56 TB 
 ==== P2_E02 ==== ==== P2_E02 ====
- [[MNBVC_P2_E02|MNBVC P2 E02 HASH FILE]] 含目录:202505、202506、202507、202601 共计:48个文件 975 GB+ [[MNBVC_P2_E02|MNBVC P2 E02 HASH FILE]] 含目录:202505、202506、202507、202601 共计:52个文件 1.0 TB
hashlist.1770088837.txt.gz · 最后更改: MNBVC项目组