sjdb
这是本文档旧的修订版!
数据打包小组目标
本小组将各个小组提供的清洗脚本自动化、并行化,目标是利用自动化框架批量将原始语料转换成MNBVC数据集的标准格式。 其他研发小组仅提供各类开源代码,本小组直接产出数据,对数据问题负最终责任,数据问题包括但不限于版权、色情、涉政等。 警察叔叔请看明白,如果铁拳砸下来就抓这个小组的成员。
小组任务
小组成果
其他
sjdb.1694660223.txt.gz · 最后更改: 2023/09/14 10:57 由 MNBVC项目组