dmyl
这是本文档旧的修订版!
代码语料小组目标
关注代码语料的处理,包括github、gitlab等各大代码仓库的最新代码、commit数据、issue数据等的爬取和清洗。
小组任务
1. github issues信息获取
2. github commits信息获取
3. 其他代码托管平台调研
小组成果
github仓库元信息下载:https://github.com/washing1127/publicRepos_mnbvc
github仓库代码下载+语料提取:https://github.com/imgingroot/github_downloader_mnbvc
代码仓库语料提取:https://github.com/LinnaWang76/githubcode_extractor_mnbvc
googleSourceCode下载:https://github.com/washing1127/googleOpenSourceCode_mnbvc
dmyl.1692341301.txt.gz · 最后更改: 2023/08/18 14:48 由 MNBVC项目组