有没有一种方法可以生成问答对的一个句子摘要?
例如,条件是:
Q: What is the color of the car?
A: Red我想要生成一个摘要
The color of the car is red或者,给予
Q: Are you a man?
A: Yes至
Yes, I am a man.这说明了问题和答案。
做这件事最合理的方法是什么?
发布于 2016-07-07 03:10:09
我曾经致力于解决相反的问题,也就是从维基百科文章中的句子中产生问题。
我使用斯坦福分析器从我的训练数据集中的所有可能的句子中生成解析树。
例如:
我基本上在1000个句子中收集了这些模式,对每个模式有多常见进行了分类,然后找出了如何最好地修改这个解析树,以便在一个不同的Wh-问题中转换成每个句子(什么,谁,何时,何地,为什么等等)
你可以很容易地做一些非常相似的事情。研究所有培训数据的解析树,并找出您可以提取哪些模式来完成您的工作。在很多情况下,只要用答案代替问题中的Wh单词,你就会得到一个有效的句子,尽管有些尴尬。例如:“红色是汽车的颜色。”
比如“你是个男人吗?”(例如,主要动词是' are ','can',‘应该’等等),交换前两个单词通常是“你是个男人吗?”
发布于 2016-06-30 14:08:09
我不知道有什么NLP任务可以显式地处理您的需求。
一般说来,有两种问题。期望有一篇文章作为答案的问题,如定义或解释排序:What is Ebola Fever。第二种类型是填补空白,在文献中称为Factoid Questions,如What is the height of Mt. Everest?。你想总结什么样的问题还不清楚。我假设你对事实问题感兴趣,因为你的例子只提到它们。
在Question Answering的任务中也出现了一个类似的问题。此任务的第一阶段之一是生成查询。在本文:An Exploration of the Principles Underlying Redundancy-Based Factoid Question Answering; Jimmy Lin 2007中,作者声称,通过将查询(参见4.1节)重新定义为更有可能出现在自由文本中的表单,可以获得更好的性能。让我照搬文件中讨论的一些例子。
1. What year did Alaska became a state? 2. Alaska became a state ?x
1. Who was the first person to run the miles in less than four minutes? 2. The first person to run the miles in less than four minutes was ?x
在上面的示例中,1中的查询被重新表示为2。正如您可能已经看到的,?x是应该由答案填充的空白。这种修改是通过十几个手写规则进行的,并被嵌入到本文讨论的软件工具:ARANEA中。你所要做的就是找到这个工具并使用它,这张纸已经有十年的历史了,我不能向你保证:)
希望这能有所帮助。
https://stackoverflow.com/questions/38105014
复制相似问题