dmyl
差别
这里会显示出您选择的修订版和当前版本之间的差别。
两侧同时换到之前的修订记录前一修订版后一修订版 | 前一修订版 | ||
dmyl [2024/12/17 19:21] – MNBVC项目组 | dmyl [2024/12/17 20:25] (当前版本) – MNBVC项目组 | ||
---|---|---|---|
行 62: | 行 62: | ||
**url地址集:**https:// | **url地址集:**https:// | ||
- | **爬虫代码:**https:// | + | **爬虫代码:**https:// |
截至2024年初,BitBucket项目已经完成的工作如下:廖星宇完成了平台调研和仓库数据获取代码,并由智完成了Code Review,廖星宇和washing完成了仓库数据获取测试。 | 截至2024年初,BitBucket项目已经完成的工作如下:廖星宇完成了平台调研和仓库数据获取代码,并由智完成了Code Review,廖星宇和washing完成了仓库数据获取测试。 | ||
- | 2024年BitBucket的工作进入了获取仓库Git clone 地址以提取语料的阶段,由whyseu 完成了clone地址获取,washing对此进行了核验并确认url获取完毕,整合的url地址集v0.1上传到了Github,5月中旬至6月,Jacky咏杰和blue进行了对BitBucket的clone地址爬虫代码的编写以及分布式改造,并将爬虫代码上传至Github,9月份完成了所有数据爬取工作。 | + | 2024年BitBucket的工作进入了获取仓库Git clone 地址以提取语料的阶段,由whyseu 完成了clone地址获取,washing对此进行了核验并确认url获取完毕,整合的url地址集v0.1上传到了Github,5月中旬至6月,Jacky咏杰和zwpride进行了对BitBucket的clone地址爬虫代码的编写以及分布式改造,并将爬虫代码上传至Github,9月份完成了所有数据爬取工作。 |
**Savannah** | **Savannah** | ||
行 88: | 行 88: | ||
在非爬虫任务中,代码语料提取、打包工作均已完成,而教科书中代码数据识别已完成了Coding部分,Code Review的工作尚未完成。 | 在非爬虫任务中,代码语料提取、打包工作均已完成,而教科书中代码数据识别已完成了Coding部分,Code Review的工作尚未完成。 | ||
+ | | ||
+ | |||
+ | | 成员昵称 | ||
+ | | 子轩 | ||
+ | | washing | ||
+ | | water | 中年企业leader,人在山东,掌握go,rust和python | ||
+ | | 🍋 | | 参与组内多项多量工作,近期较忙能联系上,有时回复较晚 | ||
+ | | zhange | ||
+ | | 廖星宇 | ||
+ | | 棒 | | 能联系上,完成GitHub爬虫工作 | ||
+ | | 智 | 360(?)非算法岗 | ||
+ | | 冬天 | ||
+ | | whyseu | ||
+ | | zwpride| https:// | ||
+ | | wxid_salb74o1i4jh21 | | 新同学,帮忙下载过一个代码托管平台的代码 | ||
+ | | 林夕 | ||
+ | | 崔自成 | ||
+ | | 逃课的人工智能 | ||
+ | | 王潇Xiao/ | ||
+ | | byeah | ||
+ | | 天空 | ||
+ | | 清泠 | ||
+ | | 王颢 | ||
+ | | Ryan | 操作系统相关工作 | ||
+ | | Jane·H | ||
+ | | | | ||
+ | |||
+ | **项目组外成员致谢** | ||
+ | |||
+ | 冠:华为代码生成组,代码语料组技术指导 | ||
+ | |||
+ | Alan:MNBVC语料增强组组长,帮忙解决一些编码方面的问题。 | ||
===== 其他 ===== | ===== 其他 ===== | ||
[[GitHub分布式爬取]] | [[GitHub分布式爬取]] |
dmyl.1734434516.txt.gz · 最后更改: 2024/12/17 19:21 由 MNBVC项目组