Linux 拨号vps windows公众号手机端

怎么使用NLTK库对齐文本

lewis 1年前 (2024-04-09) 阅读数 12 #程序编程
文章标签 NLTK

NLTK库可以通过使用align_words函数对文本进行对齐。以下是一个示例代码:

from nltk.translate import AlignedSent
from nltk.translate import Alignment

src_words = ['I', 'saw', 'the', 'man']
tgt_words = ['Je', 'ai', 'vu', 'l', 'homme']

alignment = Alignment([(0, 0), (1, 1), (2, 2), (3, 3)])

aligned_sent = AlignedSent(src_words, tgt_words, alignment)

print(aligned_sent.words)
print(aligned_sent.mots)
print(aligned_sent.alignment)

在这个示例中,我们创建了一个包含源语言单词列表和目标语言单词列表的AlignedSent对象,然后打印出对齐后的结果。您也可以使用Alignment()函数来指定单词之间的对应关系,以生成自定义的对齐结果。

版权声明

本文仅代表作者观点,不代表米安网络立场。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门