我目前正在做NLP项目,文本摘要,是否可以通过检查相似的beetwen句子来总结文本?如果可能,如何实现?或者干嘛不呢?
谢谢
发布于 2019-10-06 08:23:00
据我所知,https://www.simplish.org是一个通过语义相似度进行摘要的网站,他们的方法是将文本转换成基本的英语,然后在多维空间中为每个句子创建一个表意文字;以前的条件是将所有基本的英语单词相互关联。以第一个文本为参照,以表意文字序列为摘要空间。位于该摘要空间内的其他文档中的任何句子都被认为是相关的,并且它被保存在最终摘要中,并且任何与现有句子过于相似的句子都被忽略为重复的。由于该方法不依赖于任何特定的本体、主题地图、单词、单词集或语法,因此它可以很好地用作多语言多文档摘要生成器。请看“示例”部分,其中有一些简化文本和摘要的示例。
发布于 2017-10-03 23:53:10
通过句子相似度进行摘要是非常有可能的。使用这种相似性的最好方法之一就是聚类。我建议你看看这个。您还可以使用另一种方法进行摘要,然后使用句子相似度来查找句子之间的共享信息,避免重复形成。
发布于 2017-10-26 00:42:44
有关Python语言中提取摘要方法的示例,请参阅PyTextRank以及wiki中的相关讨论。
Mike Williams在这里还列出了一些优秀的资源和示例:https://mike.place/2016/summarization/
https://stackoverflow.com/questions/45995883
复制相似问题