跳至内容
MNBVC-Wiki
用户工具
登录
站点工具
搜索
工具
显示页面
过去修订
反向链接
最近更改
媒体管理器
网站地图
登录
>
最近更改
媒体管理器
网站地图
您的足迹:
sjbzh
本页面只读。您可以查看源文件,但不能更改它。如果您觉得这是系统错误,请联系管理员。
===== 数据标准化小组目标 ===== 将各个开源数据集对齐到MNBVC数据集格式,方便算法同学直接使用。 ===== 小组任务 ===== - 本项目主要目的是将huggingface上的ShareGPT问答语料,标准化为MNBVC的问答语料格式,标准化格式和详细说明请参见:[[sharegptqa|sharegpt数据清洗到问答语料格式]] - 本项目主要目的是将收集到的诗歌,标准化为MNBVC的标准文本格式,标准化格式和详细说明请参见:[[text_poem|诗歌数据清洗到文本语料格式]] ===== 小组成果 ===== - shareGPT问答预料:https://github.com/pany8125/ShareGPTQAExtractor-mnbvc - 诗歌语料:https://github.com/pany8125/PoemExtractor-mnbvc - 电信语料:https://github.com/pany8125/Telechat-mnbvc - TigerBot语料:https://github.com/pany8125/TigerBot-mnbvc ===== 其他 ===== * [[现有语料格式]]
sjbzh.txt
· 最后更改: 2024/03/10 06:24 由
MNBVC项目组
页面工具
显示页面
过去修订
反向链接
回到顶部