用户工具

站点工具


对齐算法

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录前一修订版
对齐算法 [2023/07/08 21:53] – [基于最长公共子序列] MNBVC项目组对齐算法 [2023/07/16 10:37] (当前版本) MNBVC项目组
行 8: 行 8:
  
 实际运行时,单个1MB的文本需要大约15分钟,并且这种做法无法并行。 实际运行时,单个1MB的文本需要大约15分钟,并且这种做法无法并行。
 +
 +但是这种做法可以在匹配比较稀疏的时候有一种优化来实现期望O(nlogn)的时空复杂度,但是我暂时还没测试,https://www.bilibili.com/read/cv25046174
  
 给定两个语言的文本,假设它们已经得到某种程度上的划分(比如已经按句子分开或者按段落分开)。但是由于语言差异,我们不能简单地根据句子或者段落顺序直接一一对齐。比如英文的两句话在对应的中文里是一句话。 给定两个语言的文本,假设它们已经得到某种程度上的划分(比如已经按句子分开或者按段落分开)。但是由于语言差异,我们不能简单地根据句子或者段落顺序直接一一对齐。比如英文的两句话在对应的中文里是一句话。
对齐算法.1688824381.txt.gz · 最后更改: 2023/07/08 21:53 由 MNBVC项目组