首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何从BerkeleyAligner中读取对齐类型?

如何从BerkeleyAligner中读取对齐类型?
EN

Stack Overflow用户
提问于 2012-01-03 02:38:04
回答 1查看 344关注 0票数 1

http://code.google.com/p/berkeleyaligner/下载主干代码后,我将项目添加到我在Eclipse上的构建路径中。然后,使用下面的代码,我可以提取从sourceFile和targetFile读取的每个句子对的对齐。对齐后,如何从BerkeleyAligner中读取Alignment类型?

代码语言:javascript
运行
复制
import edu.berkeley.nlp.wa.mt.Alignment;
import edu.berkeley.nlp.wa.mt.SentencePair;
import edu.berkeley.nlp.wordAlignment.combine.WordAlignerCombined;
public static void main(String[] args) {
BufferedReader brSrc = new BufferedReader(new FileReader ("sourceFile"));
BufferedReader brTrg = new BufferedReader(new FileReader ("targetFile"));
while ((currentSrcLine = brSrc.readLine()) !=null) {
    String currentTrgLine = brTrg.readline();
    // Reads into BerkeleyAligner SentencePair format.
    SentencePair src2trg = new SentencePair(sentCounter, params.get("source"),
        Arrays.asList(srcLine.split(" ")), Arrays.asList(trgLine.split(" ")));
    // Generate Alignment type from SentencePair
    WordAlignerCombined aligner;
    Alignment alignedPair = aligner.alignSentencePair(src2trg);
    // How do i print out the Alignment???
    }
}

例如sourceFile:

代码语言:javascript
运行
复制
this is the first line in the textfile.
that is the second line.
foo bar likes to eat bar foo.

例如targetFile:

代码语言:javascript
运行
复制
Dies ist die erste Textzeile in der Datei.
das ist die zweite Zeile.
foo bar gerne bar foo essen.
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-01-03 07:16:06

打印GIZA。Alignment有一个这样的方法:

代码语言:javascript
运行
复制
public void writeGIZA(PrintWriter out, int idx)

GIZA是:

代码语言:javascript
运行
复制
"# sentence pair (%d) source length %d target length %d alignment score : 0\n"
"NULL ({ %s })"
" %s ({ %s })" (englishSentence.get(i), StrUtils.join(alignments))

idx就是句子对的id。

out就是您要打印它的地方。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8704185

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档