这是本文档旧的修订版!
(我们都是被逼的!被…逼的!逼的,逼的……大家自行脑补Beat it)
我可以不懂AI,但不能不懂做AI啊,所以 就响应某个人的号召来做了。 一起加入的大伙们,想必也都记得,最初 被拉到一个叫摸奶不为操MNBVC的房间 迫切进行了袒露坦诚且亲切的交流,彼此 的特长啊优点啊都了如指掌。随后分工 ,进了一个叫“平行语料”的小房间。 我看到这个词时是迷糊的,迷惘的,这个 揭开我牛马序幕的词是干啥的?很快就 发现了原来平行语料就是让AI跨国界的。 等熟悉了队友之后,某人就发任务了。首 战就是搞联合国。联合国啊!这么高大上, 居然就靠我们几个小虾米去搞定?做着 心里也就平静了,毕竟是去扒拉一下网站 不是去搞破坏嘛。这个任务我给自己勉强 良好的评价吧,因为对最终产出没太明白 ,导致抓下来的网页基本用不上全白瞎了。 问题是当时确实不了解,也长经验了。里 屋毕竟常混,不好一走了之,于是就一番 是非展开了口舌言语交流,说清楚问题 何在,后续队员接手换方向搞定了。不 管怎么样,本组的活就这么推进下去了。 乃们想要看戏的心情可以收一收了,下来 不论啥任务都没出过大幺蛾子。搬着砖不 知不觉一年就过去了,期间以联合国为主, 有一些字幕的活。我呢,在摸鱼做AI。 龙年即将到来的时候,联合国语料在一个 无比寻常的日子里接近完成,所剩唯完善 论文了。这个时候,某人一句话让大家 傻眼:平行语料不光联合国,还有很多活, 哥几个动下脑子,想想还有什么是能做的 。 其实,这又回到了平行语料的定义了。某 人也举了些例子来说明。总之我们也不用 妄图搞大而全,就以中英文间的对齐为始, 谋定后动,争取不做无用功。具体安排则 尊重大家的意见,合理的优先,复杂的让 位给做起来简单的,语必须同时有中英文 ,等等。 大家各抒己见,bs(brainstorming)中 统一了意见,那就是搞游戏。有队员认 领寻找游戏语料,有队员认领语料对齐。 明确了大致任务,大家又有了新动力~~ 鉴于本文渐水,长话短说,又一年过去了 。我们组又为中文语料集添了块砖。
(注:为手机浏览方便,本文经AI排版,严禁跨省区追捕!) (再注:里屋虽然没有打赏功能,不过大家可以合理利用各种道具往lz头上砸猫皮/肉肠,来者不限) (发帖时间Beijing: 2025-01-08 15:56:06 |Beijing: 2025/1/8 15:56:06)
—worldhello【以有涯随无涯,殆已】