用户工具

站点工具


wdyl

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录前一修订版
后一修订版
前一修订版
上一修订版两侧同时换到之后的修订记录
wdyl [2024/06/01 16:38] MNBVC项目组wdyl [2024/06/22 11:50] – [homestudy] MNBVC项目组
行 6: 行 6:
   * word试卷清洗(进行中,负责人:图北)   * word试卷清洗(进行中,负责人:图北)
   * 第一试卷网的整理 (进行中,负责人:图北&林)   * 第一试卷网的整理 (进行中,负责人:图北&林)
-  * homestudy的下载和整理(进行中,负责人:莫慢待) 
   * indiabix的数据下载和整理(进行中,负责人:图北)   * indiabix的数据下载和整理(进行中,负责人:图北)
   * quora分布式爬虫(进行中,负责人:[!])   * quora分布式爬虫(进行中,负责人:[!])
 +  * homestudy的下载和整理(已完成,负责人:莫慢待)
   * moss数据的整理(已完成,负责人:Roger)   * moss数据的整理(已完成,负责人:Roger)
   * wikihow(已完成,负责人:挖泥船)   * wikihow(已完成,负责人:挖泥船)
   * 外交部问答数据(已完成,负责人:curry)   * 外交部问答数据(已完成,负责人:curry)
 +
 +
 +==== homestudy ====
 +Homework.Study.com 是一个综合性的学习和作业帮助平台,上面按各学科以及小类归纳了问题,问题有唯一的标准答案。
 +
 +任务步骤:
 +  1. 选取想要的学科,通过F12找到目录的url,通过遍历可以获得所有学科内问题的url
 +  2. 访问具体问题的url,可获得详情,其中问、答和扩展格式一致,按照指定的标签提取即可
 +  
 + [[https://github.com/LxYxvv/quora_distributed_crawler|代码仓库]]
 +
  
 ==== quora分布式爬虫 ==== ==== quora分布式爬虫 ====
wdyl.txt · 最后更改: 2024/06/22 11:51 由 MNBVC项目组