对齐算法
差别
这里会显示出您选择的修订版和当前版本之间的差别。
两侧同时换到之前的修订记录前一修订版 | |||
对齐算法 [2023/07/08 21:53] – [基于最长公共子序列] MNBVC项目组 | 对齐算法 [2023/07/16 10:37] (当前版本) – MNBVC项目组 | ||
---|---|---|---|
行 8: | 行 8: | ||
实际运行时,单个1MB的文本需要大约15分钟,并且这种做法无法并行。 | 实际运行时,单个1MB的文本需要大约15分钟,并且这种做法无法并行。 | ||
+ | |||
+ | 但是这种做法可以在匹配比较稀疏的时候有一种优化来实现期望O(nlogn)的时空复杂度,但是我暂时还没测试,https:// | ||
给定两个语言的文本,假设它们已经得到某种程度上的划分(比如已经按句子分开或者按段落分开)。但是由于语言差异,我们不能简单地根据句子或者段落顺序直接一一对齐。比如英文的两句话在对应的中文里是一句话。 | 给定两个语言的文本,假设它们已经得到某种程度上的划分(比如已经按句子分开或者按段落分开)。但是由于语言差异,我们不能简单地根据句子或者段落顺序直接一一对齐。比如英文的两句话在对应的中文里是一句话。 |
对齐算法.1688824381.txt.gz · 最后更改: 2023/07/08 21:53 由 MNBVC项目组