hashlist
差别
这里会显示出您选择的修订版和当前版本之间的差别。
| 两侧同时换到之前的修订记录前一修订版后一修订版 | 前一修订版 | ||
| hashlist [2026/02/03 11:20] – [P2_E02] MNBVC项目组 | hashlist [2026/02/03 11:29] (当前版本) – [超大规模中文语料集 Part2] MNBVC项目组 | ||
|---|---|---|---|
| 行 7: | 行 7: | ||
| 20250813 更新P1_E01内4组数据包 | 20250813 更新P1_E01内4组数据包 | ||
| 20251010 累计更新P1_E01内11组数据包 | 20251010 累计更新P1_E01内11组数据包 | ||
| - | 20251014 新增20250624数据包 | + | 20251014 新增1组数据包 |
| - | 20251104 更新20230114数据包 | + | 20251104 更新1组数据包 |
| - | 20251108 更新20250102数据包 | + | 20251108 更新1组数据包 |
| - | 20251127 新增9组数据包 | + | 20251127 新增9组数据包 |
| - | 20260104 新增20250634 | + | 20260104 新增1组数据包 |
| + | 20260202 更新1组数据包 新增8组数据包 新增202601目录 | ||
| ===== 超大规模中文语料集 Part1 ===== | ===== 超大规模中文语料集 Part1 ===== | ||
| 行 35: | 行 36: | ||
| ===== 超大规模中文语料集 Part2 ===== | ===== 超大规模中文语料集 Part2 ===== | ||
| - | 共计:138个文件 2.39 TB | + | 共计:147个文件 2.50 TB |
| ==== P2_E01 ==== | ==== P2_E01 ==== | ||
| | | ||
| ==== P2_E02 ==== | ==== P2_E02 ==== | ||
| | | ||
hashlist.1770088837.txt.gz · 最后更改: 由 MNBVC项目组
