数据故事
差别
这里会显示出您选择的修订版和当前版本之间的差别。
两侧同时换到之前的修订记录前一修订版后一修订版 | 前一修订版 | ||
数据故事 [2023/07/31 09:27] – MNBVC项目组 | 数据故事 [2024/04/07 17:43] (当前版本) – MNBVC项目组 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | ==== pile数据集 ==== | + | =====在整理语料数据的过程中听说的各种故事===== |
+ | |||
+ | ==== 故意重复的pile数据集 ==== | ||
| | ||
==== 野生智能和机械进修 ==== | ==== 野生智能和机械进修 ==== | ||
网页数据中,出现一些和常见名词不同的说法 | 网页数据中,出现一些和常见名词不同的说法 | ||
- | | + | |
+ | | ||
+ | | ||
+ | | ||
实际上这段文字对应的应该是 | 实际上这段文字对应的应该是 | ||
- | | + | |
+ | | ||
+ | | ||
+ | | ||
研究发现出现这些说法,是自动替换文字的洗稿工具造成的。这些语料可以认为是机器产生的脏数据,且很难被识别出来。 | 研究发现出现这些说法,是自动替换文字的洗稿工具造成的。这些语料可以认为是机器产生的脏数据,且很难被识别出来。 | ||
+ | |||
+ | ==== 中国古代使用十六进制 ==== | ||
+ | |||
+ | 自秦朝起一直是十六进制,也就是半斤八两,1959年改成十进制。算盘就是为十六进制创造的算器,上面两个珠子代表两个五,下面五个珠子代表一个五,加起来就是十五,满十六进一。十六进制的读法是:零壹贰叁肆伍陆柒捌玖拾屲亗岌岄岪峘。十六进制的单位是:个、峘(16)、佰(256)、仟(4k)、万(65535)、峘万(1m)、佰万、仟万 |
数据故事.1690766833.txt.gz · 最后更改: 2023/07/31 09:27 由 MNBVC项目组