NLP中包含连字符的复合名词提取困难

python、python-3.x、string、nlp、spacy

背景和目标我想从每个句子中提取名词和复合名词，包括连字符，如下所示。如果它包含连字符，我需要用连字符提取它。在复合名词的第一个单词上有标签“复合”，但我现在无法提取我期望的内容。.: ['web camera', 'computer'

浏览 16提问于2020-10-15得票数 2

回答已采纳

3回答

用Spacy从句子中寻找复合名词-形容词对有什么好的解决方案？

python、sentiment-analysis、spacy

然而，在我的说明中，我打算从输入句子中提取复合名词-形容词对作为关键短语。我认为Spacy提供了许多处理NLP任务的实用程序，但没有找到我想要的任务的满意线索。我在SO、中查看了一个非常类似的帖子，解决方案效率不高，不适用于自定义输入语句。下面是我尝试过的代码：nlp=en_core_web_sm.load() def

浏览 0提问于2018-11-27得票数 0

1回答

用Spacy POS/DEP提取句子:参与者与行动

python-3.x、spacy-3

谢谢你的帮助。我使用spacy解析文档，查找特定单词的实例，并在新的dfcolumn中提取句子。以下是一些文本： text = (sent_list)此代码工作良好，并提取包括欧盟实体在内的所有句子。我试着用POS/Dependency把专有名词和动词结合起来，但是nsubj并不总是正确的，或者nsubj连接到<

浏览 3提问于2022-08-18得票数 0

2回答

在文档中写出“命令行/命令行”的“适当”方式是什么？

readme

我去寻找一个结论性的答案，但没有找到多少(见和)。我的结论是，这可能并不重要，而且“命令行”似乎更常见，但现在我很好奇，还有其他人遇到过这个问题吗？如果你是一个行业专家，记录你的代码，你有没有提供过答案？附带注意:我在这里讨论是否要问这个问题，因为这肯定是一个代码相邻的问题，但考虑到如果您正在编写代码，您也应该编写文档，我认为它符合“软件开发特有的实用的、可回答的问题”的标准。

浏览 9提问于2022-07-01得票数 0

回答已采纳

1回答

Spacy -标记引号字符串

python-3.x、nlp、spacy

我使用spacy 2.0，并使用一个引号字符串作为输入。示例字符串并期望提取然而，我在实验中得到了一些奇怪的结果。名词块和名词省略了其中一个引语。import spacy nlp = spacy.

浏览 0提问于2018-06-08得票数 7

回答已采纳

2回答

无意义的空间名词

python、text、spacy、wordnet

我用Spacy从句子中提取名词。这些句子在语法上很差，也可能包含一些拼写错误。下面是我使用的代码：import spacy这说明这些名词都有一些无意义的词，如: sfx、foward2、ms、64x、bit、pwm、r、brailledisplayfastmovement

浏览 10提问于2021-03-22得票数 4

回答已采纳

3回答

如何防止电子邮件地址的css自动连字符

javascript、html、css、hyphenation

我使用CSS连字符(hyphens:auto;)在网站上的文本段落。有时，电子邮件地址会被连字符，从而导致域名“错误”。由于这是用户生成的内容，因此无法手动添加html元素。我正在考虑用JavaScript解析文本，在电子邮件地址中添加特殊的标记，并在这些标记上使用hyphens:none;。但我担心的是表演。(我认为这是一个问题，尤其是在德文文本中，那里有许多复合名词)

浏览 2提问于2013-12-12得票数 4

回答已采纳

2回答

Python -“撤销”文本换行

python、nlp、nltk

我需要获取一个文本并删除\n字符，我相信我已经这样做了。下一个任务是将连字符从不应该出现的单词中删除，而将连字符留在复合词中应该出现的单词中。Comp_Ling_Research_1\BROWN_A1_hypenated.txt', 'rU') as myfile: data=myfile.read().replace('\n', '&#x

浏览 20提问于2016-09-26得票数 1

回答已采纳

1回答

基于POS前标记的合并令牌

python、nlp、spacy、text-processing、part-of-speech

我想实现一些文本操作，作为对关键短语提取的预处理。existing underground gas storage facilities into storage facilities dedicated to hydrogen-storage" doc = nlp(text) print(f'{token.text:{8}} {token.pos(例如存储)被一个<e

浏览 7提问于2022-05-26得票数 0

1回答

Python :改进从dataframe和命名实体中提取二进制文件的方法？

python、pandas、nlp、spacy、n-gram

我使用Python作为我的NLP库，开发一个包含关于不同汽车的反馈的大数据文件，如下所示： “实体”列包含从反馈文本中提取的命名实体，并提取任何名词+动词、动词+名词、adj+名词、adj+专有名词</em

浏览 6提问于2022-04-30得票数 0

回答已采纳

1回答

如何计算不含spaCy停止词的名词文档的TF值？

python-3.x、list、dataframe、nlp、spacy

text和cleaned_text包含字符串文档，nouns是从cleaned_text列提取的名词列表。df.shape = (1927, 3)。我试图仅为名词计算df 中所有文档的spaCy值，不包括spaCy秒词。 from spacy.lang.en import English # subclass to mo

浏览 1提问于2022-03-12得票数 1

1回答

封闭复合词的检测

python、part-of-speech

英语中的复合词主要有三种类型： Open (e.g. ice cream, living room, etc.)nlp = spacy.load("en_core_web_sm") sentence = 'I

浏览 29提问于2021-08-19得票数 0

2回答

NLP -提取“正确”名词短语

regex、nlp

我遇到了一个与NLP相关的问题，我希望我能得到一些建议来帮助解决它。我目前正在写一个程序，在这个程序中，给定一个包含货币数字的句子，程序将能够返回与该数字相对应的名词短语。我正在将名词短语“自行车”与“100美元”相匹配。我正在使用Stanford NLP的解析器来查找句子中的名词短语，如您所知，名词短语中包含

浏览 8提问于2013-11-24得票数 1

3回答

如何从python中的短语中提取中心名词？

python、nlp

我正在做一个关键词组分类任务，为此，我使用python中的关键词组中的中心名词提取。互联网上提供的一些帮助并没有很好的用处。我正在为此而苦苦挣扎。

浏览 3提问于2018-09-20得票数 1

1回答

从Dataframe中提取名词并将它们存储在另一个行中

python、nlp、text-extraction

我在练习NLP，有个问题。我有一个包含几行句子的数据集。每一行都贴上标签很容易。现在，我想从这些行中提取名词，并将它们存储在相应行的另一列中。= data['Pos Tags']for (word,tag) in i: nouns.append(word) 下面是代码的示例，在此之后，我不知道如何将这些名词存储在另一列<e

浏览 6提问于2022-07-20得票数 0

回答已采纳

2回答

我想使用基于规则的匹配，我有一个文本，每个单词都有POS： text1= "it_PRON is_AUX a_DET beautiful_ADJ apple_NOUN" text2= "it_PRONis_AUX a_DET beautiful_ADJ and_CCONJ big_ADJ apple_NOUN" 因此，我想创建一个基于规则的匹配提取，如果我们有一个ADJ后跟名词( noun )，或者一个ADJ后跟(PUNCT或CCONJ)后跟一个ADJ后跟一个名词</

浏览 9提问于2020-12-22得票数 1

回答已采纳

3回答

NLP提取相关短语

nlp、stanford-nlp

使用给定句子中的NLP，我可以很容易地使用核心NLP提取所有的形容词和名词。但我努力要做的实际上是从句子中提取短语。我该怎么做？谢谢,

浏览 3提问于2017-05-17得票数 2

1回答

在使用scikit-learn`s的术语文档矩阵时，如何防止连字符的单词被标记化？

python、scikit-learn、nlp、term-document-matrix

我目前正在处理一个大型的文章语料库(大约205,000篇)，这需要构建一个术语文档矩阵。我环顾四周，似乎sklearn提供了一种有效的方式来构建它。但是，当将建议的代码应用于一小部分文档时(作为测试)，我发现包含连字符的单词是分开的，以连字符作为分隔符。这是不可取的，因为我正在使用葡萄牙语的文档，其中由于大量的复合名词，<em

浏览 33提问于2021-10-29得票数 0

1回答

名词中介关系在OpenIE中找不到

stanford-nlp、information-extraction

我在提取名词中介关系时遇到了困难，正如中所概述的那样。当我在当地运行OpenIE时，“美国总统巴拉克·奥巴马( Barack )周一访问了印度”只提取了两种关系：但是，当我在上运行相同的输入时，第三个关系看起来是要提取的。更有趣的是，如果我从corenlp.run

浏览 0提问于2016-10-07得票数 0

回答已采纳

1回答

使用Stanford Parser提取包含特定单词的名词短语

java、nlp、stanford-nlp

如何使用Stanford Parser提取包含特定单词的名词短语。我可以使用这篇文章中写的代码来提取名词短语：但是，我需要获取包含特定单词的名词短语，但是这并不像进行字符串搜索那么简单，因为该单词可以在句子中出现两次。因此，我需要提取包含句子特定顺序的特定单词的名词短语。，第二次作为句子<

浏览 0提问于2014-02-09得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

用Spacy从句子中寻找复合名词-形容词对有什么好的解决方案？

用Spacy POS/DEP提取句子:参与者与行动

在文档中写出“命令行/命令行”的“适当”方式是什么？

Spacy -标记引号字符串

无意义的空间名词

如何防止电子邮件地址的css自动连字符

Python -“撤销”文本换行

基于POS前标记的合并令牌

Python :改进从dataframe和命名实体中提取二进制文件的方法？

如何计算不含spaCy停止词的名词文档的TF值？

封闭复合词的检测

NLP -提取“正确”名词短语

如何从python中的短语中提取中心名词？

从Dataframe中提取名词并将它们存储在另一个行中

有没有一种基于规则的spacy匹配方法来匹配模式？

NLP提取相关短语

在使用scikit-learn`s的术语文档矩阵时，如何防止连字符的单词被标记化？

名词中介关系在OpenIE中找不到

使用Stanford Parser提取包含特定单词的名词短语

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐