如何从文本中提取所有可能的名词短语_使用Textblob从文本中删除所有名词短语_如何获取Spacy中的所有名词短语 - 腾讯云开发者社区

java、text、nlp、stanford-nlp、opennlp

我有一个文本，我想从中提取名词短语。我可以很容易地获得我拥有的文本的类型化解析器，但是我想知道如何提取文本中的名词短语？

浏览 2提问于2012-06-11得票数 13

1回答

如何提取葡萄牙语的名词/动词短语？

python、nlp、text-mining、spacy、textblob

我发现了各种工具来提取英语中的动词和名词短语，包括在stackoverflow中的一些问题中。然而，我发现的技术似乎只适用于英文文本。我尝试过spacy和textblob，但它们不会返回任何葡萄牙语文本(在英语中完全有效)。以下是我在葡萄牙语中尝试过的方法: doc.noun_chunks中的Spacy to extract specific noun phrase块在英语中可以完美地工作，但是有人知道葡萄牙语已经存在的技术吗？我在找所有我知道的地方。

浏览 12提问于2019-12-30得票数 2

2回答

有词组找头器吗？

java、nlp

我有一些句子我想解析。这是我所拥有的和我需要的:我有这样的句子：我当时在医院。我要从家里去加拿大。我想知道的是“在医院”、“从家里”和“到加拿大”的词组。我正在使用Berkley解析器，但是它给我的是所有句子的解析结果，如果我想手动提取短语的头，我应该开发另一个解析器！我想解析的文件是一个很大的文件，所以如果我自己开发一个解析器，它可能会有很多错误。有什么解析器可以给我我想要的结果吗？顺便说一句，由于将短语分开分析，可能会导致与句子分析不同的句法分析，所以我坚持对句子进行解析，然后提取短语头。

浏览 2提问于2012-05-26得票数 4

回答已采纳

1回答

SpaCy中非名词短语的分块

python-3.x、nlp、spacy

对不起，如果这似乎是一个愚蠢的问题，但我对Python和SpaCy还不熟悉。我有一个包含客户投诉的数据框架。看起来有点像这样： df = pd.DataFrame( [[1, 'I was waiting at the bus stop and then suddenly the car mounted the pavement'], [2, 'When we got on the bus, we went upstairs but the bus braked hard and I fell'],

浏览 1提问于2020-02-20得票数 0

回答已采纳

1回答

用Python从nltk树结构中提取特定叶值

python、tree、nltk

我有一些关于NLTK的树函数的问题。我正在尝试从树结构中提取一个特定的单词，如下所示。 test = Tree.parse('(ROOT(SBARQ(WHADVP(WRB How))(SQ(VBP do)(NP (PRP you))(VP(VB ask)(NP(DT a)(JJ total)(NN stranger))(PRT (RP out))(PP (IN on)(NP (DT a)(NN date)))))))') print "Input tree: ", test print test.leaves() (SBARQ (WHADVP (WR

浏览 2提问于2013-05-07得票数 6

回答已采纳

1回答

如何给一句话中的每一块打分？

nlp、tf-idf、part-of-speech

我正在做一个关键字提取任务，在这个任务中我想提取短语而不是单词。为了将每个句子分成有意义的部分，我首先对词性进行标注，然后根据语言规则仅提取名词短语。每个名词短语都是一个潜在的待提取关键字。然而，因为我只需要为每个给定的文档提取'k‘关键字，所以我需要一个很好的方法来对提取的名词短语进行排名。一种简单的方法是计算每个术语(在每个名词短语中)的TDIDF得分，然后每个名词短语的得分将是其构成术语的TDIDF得分的乘积。我想知道是否有人有更好的方法，或者对我简单天真的解决方案有什么想法？

浏览 1提问于2015-10-15得票数 0

1回答

python空间向后查找块(在引用之前)

python、nlp、grammar、spacy、chunks

我在一个NLP项目中使用spacy。使用Spacy创建文档时，可以通过以下方式查找文本中的名词块(也称为“名词短语”)： import spacy nlp = spacy.load("en_core_web_sm") doc = nlp(u"The companies building cars do not want to spend more money in improving diesel engines because the government will not subsidise such engines anymore.") for chunk

浏览 0提问于2019-07-01得票数 0

回答已采纳

1回答

用于关键字提取的OpenNLP NLP工具

keyword、opennlp

我希望从一组文档(pdf、docx、txt)中提取关键字/标记，使用opennlp API进行标记。有人能建议我如何使用opennlp工具提取关键字吗？

浏览 5提问于2014-05-22得票数 2

1回答

如何打印依赖关系图的一部分

java、nlp、stanford-nlp

我想打印依赖图的子树。对于句子"I turn the red meat“和起始词meat-NN，输出应该是："the red meat”。现在我是这样做的 protected String printSubGraph(IndexedWord startingWord, SemanticGraph graph) { Iterable<SemanticGraphEdge> outiter = graph.outgoingEdgeIterable(startingWord); // set the default bounds to the start

浏览 3提问于2013-09-30得票数 1

回答已采纳

2回答

如何在Spacy(Python)中获取所有名词短语

python、nlp、spacy

我想从一个句子中提取“所有”名词短语。我在想我怎么能做到。我有以下代码： doc2 = nlp("what is the capital of Bangladesh?") for chunk in doc2.noun_chunks: print(chunk) 输出： 1. what 2. the capital 3. bangladesh 预期：孟加拉国首都我试过了spacy和StackOverflow的答案。什么都没用。似乎只有cTakes和Stanford core NLP才能给出这样复杂的NP。任何帮助都是非常感谢的。

浏览 0提问于2019-03-10得票数 3

回答已采纳

1回答

提取中心名词

java、stanford-nlp

我想知道我们如何提取中心名词？我使用了一个不起作用的选民解析器，但我想我必须使用依赖解析器。我运行了这个演示代码，但它给了我一个错误的答案。 public class dependencydemo { public static void main(String[] args) throws IOException { PrintWriter out; if (args.length > 1) { out = new PrintWriter(args[1]); } else { out = new PrintWriter(System.

浏览 2提问于2015-03-26得票数 0

3回答

提取三元主谓宾句

nlp

我试图从句子中提取三元组的主语、谓语和宾语。我需要更多关于如何做到这一点的参考。

浏览 3提问于2011-11-09得票数 14

回答已采纳

1回答

从文本中提取协议特征

java、nlp、stanford-nlp、opennlp

我正在进行一项任务，我必须提取文本中名词的一致特征.该协议的特点如下： number = singular, plural person = first, second, third gender = male, female, neuter animacy = animate, inanimate 有没有从文本中提取这些特征.

浏览 3提问于2012-06-18得票数 3

1回答

使用Stanford Parser提取包含特定单词的名词短语

java、nlp、stanford-nlp

如何使用Stanford Parser提取包含特定单词的名词短语。我可以使用这篇文章中写的代码来提取名词短语：但是，我需要获取包含特定单词的名词短语，但是这并不像进行字符串搜索那么简单，因为该单词可以在句子中出现两次。因此，我需要提取包含句子特定顺序的特定单词的名词短语。假设我有这样一句话： String some_sentence = "The dog ran after the intruding bigger dog"; 狗出现了两次，第一次作为句子中的第二个单词，第二次作为句子中的最后一个单词。如何提取包含第一次出现的狗的名词短语？

浏览 0提问于2014-02-09得票数 0

1回答

从java中的词干文本中提取专有名词

java、nlp、opennlp、porter-stemmer

我正在使用OpenNLP从句子中提取专有名词。下面是我的代码： import java.io.FileInputStream; import java.io.InputStream; import java.util.HashSet; import java.util.Set; import opennlp.tools.cmdline.parser.ParserTool; import opennlp.tools.parser.Parse; import opennlp.tools.parser.Parser; import opennlp.tools.parser.ParserFactor

浏览 5提问于2016-03-14得票数 1

2回答

如何使用StanfordNLP在python中提取丹麦语中的名词短语？

python、nlp、nltk、stanford-nlp

到目前为止，我已经在python中使用了stanfordnlp库，并对文本数据进行了标记和POS标记。我现在想试着提取名词短语。我尝试过两种不同的方法，而且我对两者都有疑问：据我所见，stanfordnlp python库似乎没有提供NP分块，至少我还没有找到这样的方法。我试着用词性标签对所有单词做一个新的数据，然后检查名词是否被重复。然而，对我来说，这是非常粗糙和相当复杂的。我已经能够使用nltk来处理英语文本，所以我也尝试在NLTK中使用斯坦福CoreNLP API。我在这方面的问题是，我需要一个丹麦模型时，建立CoreNLP与Maven (这是我非常缺乏经验)。对于本文的问题

浏览 0提问于2019-05-14得票数 0

1回答

关于情感分析的自然语言处理工具列表-你推荐哪一种？

twitter、nlp、nltk、sentiment-analysis

首先为我不太完美的英语道歉..。(我来自德国;) 因此，在我的一个研究项目(学士论文)中，我需要分析一些公司和品牌在推特上的情绪。为此，我需要编写我自己的程序/使用某种修改过的开源代码(没有APIs我需要了解正在发生的事情)。下面是我找到的一些NLP应用程序的列表。我现在的问题是，你会推荐哪一种和哪种方法？哪一个不需要长时间的夜晚调整代码？例如:当我在推特上看到音乐播放器>iPod<时，有人写道：“这是糟糕的一天，但至少我的iPod让我感到高兴”，甚至更难：“这一天很糟糕，但至少我的iPod弥补了这一天。” 哪个软件足够聪明，可以理解焦点集中在iPod而不是天气上？另外，哪个

浏览 4提问于2012-09-06得票数 15

回答已采纳

5回答

带空间的名词短语

python、spacy

如何使用spacy从文本中提取名词短语？我指的不是部分语音标签。在文档中，我找不到任何关于名词短语或常规解析树的信息。

浏览 3提问于2015-10-22得票数 36

回答已采纳

3回答

NN VBD IN DT NNS RB在NLTK中是什么意思？

python、nlp、nltk、text-parsing、pos-tagger

当我分块文本时，我在输出中得到了很多代码，比如NN, VBD, IN, DT, NNS, RB。有没有记录在案的清单，告诉我这些东西的含义？我试过用谷歌搜索nltk chunk code nltk chunk grammar nltk chunk tokens。但是我找不到任何文档来解释这些代码的含义。

浏览 1提问于2015-03-30得票数 27

回答已采纳

3回答

提取特定名词短语的Spacy

python、nlp、nltk、spacy

我可以使用python中的spacy来查找具有特定邻居的NP吗？我想从我的文本中有动词前后的名词短语。

浏览 5提问于2017-06-21得票数 8

3回答

从文本中提取位置的方法？

nlp、text-mining、information-extraction、named-entity-recognition、named-entity-extraction

从自由文本中提取位置的推荐方法是什么？我能想到的是使用正则表达式规则，比如“单词……在位置”。但是，还有比这更好的方法吗？此外，我还可以考虑使用一个查找哈希表，其中包含国家和城市的名称，然后将从文本中提取的每个令牌与哈希表的每个令牌进行比较。有没有人知道更好的方法？编辑:我正在尝试从tweet文本中提取位置。因此，大量tweet的问题也可能会影响我对方法的选择。

浏览 0提问于2013-07-20得票数 10

回答已采纳

1回答

如何通过OpenNLP从HTML格式的EMail文件中提取数据？

java、nlp、stanford-nlp、opennlp、named-entity-recognition

我在一个项目中工作，在这个项目中，我通过电子邮件发送了来自各种快递代理的收据。这些电子邮件是HTML格式。但是，它们并不都形成一个特定的结构。每封电子邮件的格式都不同。我尝试过jsoup来提取数据，但是很难为每种特定类型的html编写提取代码。我需要从邮件中提取姓名，从位置，到位置，组织和其他一些细节。我尝试过openNLP，但它无法识别所有位置和名称。如果是句子形式，它会捕捉到一些位置。我是否可以创建自己的包含html内容的训练数据，对其进行注释，并根据训练数据中的html结构对其进行训练，以检测位置和名称？

浏览 0提问于2016-01-03得票数 0

1回答

从预处理文本中提取SVO三元组的规则是什么？

python、nlp、text-mining、feature-extraction

如果你有一些已经被标记的预处理文本，如果你想要一个三重(单词，单词，单词)，那么提取主语-动词-对象(SVO)三元组的规则是什么？你能给出这个句子的例子并提取所有的三元组吗？你只需要找到所有的组合，而不重复从一组N字？

浏览 0提问于2018-10-06得票数 5

3回答

我如何学习实用的自然语言处理？

java、frameworks、nlp

我有一些Java、Pascal、PERL、SQL和R方面的背景知识，并且希望找到一条从这种背景中获得自动或半自动从文本中提取概念并将结果转化为可进行统计分析(如果需要的话愿意学习新语言)的合理的最小阻力路径。我想我将需要在几千页的文本上执行一些NLP任务，特别是POS处理、名词短语的识别、词义消歧。后者，我相信，可能需要半监督机器学习的准确性。我的问题是从哪里开始学习实用的 NLP？参加一门课程或阅读NLP书籍似乎涉及到更多关于NLP任务执行方式的细节，比我现在所需要的要详细得多--我只需要知道它能做什么，它有多精确，还有什么替代方案。跳进一些现有的NLP框架似乎会让我陷入困境。我使用GATE

浏览 4提问于2013-10-05得票数 0

回答已采纳

1回答

如何在java中使用stanford nlp从文本中获取有意义的单词

java、parsing、stanford-nlp

我有一些要求，那就是在java中使用stanford nlp从解析的文本中获取有意义的单词。我正在尝试下面的示例代码。 import edu.stanford.nlp.trees.*; import edu.stanford.nlp.ling.HasWord; import edu.stanford.nlp.parser.lexparser.LexicalizedParser; public class Demo { public static void main(String args[]) { Lexicalize

浏览 0提问于2013-07-26得票数 2

1回答

利用nltk中的朴素贝叶斯提高电影评论文本分类的准确性

python-3.x、nlp、nltk、data-science、text-classification

我指的是，用于生成电影评论分类器。量词是指与名词、形容词、动词相对应的词。作为特征集的一部分。我试图建立一个分类器，它只考虑动词，并评估电影评论是正面还是负面。请解释这种方法是否更好，如果是的话，如何改进它，否则，还需要包括哪些其他部分的语音标记，以改善特征集。请参阅以下代码进口nltk和语料库了解类别创建一个“文档”列表，其中每个文档由不在stopwords.words()中的单词组成，并从“标点符号”列表中筛选出来。对文档进行洗牌，生成一个名为"all_words“的列表，其中包含movie_reviews中出现的所有单词，减去停止词和标点符号。创

浏览 0提问于2017-12-30得票数 1

1回答

如何使用NLP库从新闻报纸文章中提取信息？

machine-learning、nlp、opennlp

我正在做大学最后一年的项目，我的任务是从包含犯罪的新闻中提取因果关系。我还得找出犯罪地点。我使用OPENNLP名称实体识别器提取位置。我训练了一个定位名的模型，到目前为止，它对我的场景很好。现在我正在搜索一些东西(一种方法或一种图书馆)来提取因果关系。这是我正在使用的一条新闻的快照，而我想要提取的是粗体和意大利语文本。为了这个目的，需要一个库的帮助，就像OPENNLP一样，或者任何可能有用的东西或者我来执行这个任务。新闻1：卡拉奇:周一，至少有12人在城市被枪杀，其中两人显然死于宗派袭击，另一人是穆塔希达·卡米运动( Muttahida Qaumi )活动分子。新闻2：卡拉奇:据Ge

浏览 1提问于2013-12-11得票数 2

回答已采纳

1回答

预测短语而不是下一个单词

algorithm、autocomplete、n-gram、phrases

对于我们构建的应用程序，我们使用一个简单的单词预测统计模型(如)来指导搜索。它使用从大量相关文本文档中收集的一系列ngram。通过考虑前面的N-1词，它提出了5个最有可能的“下一个词”，按概率的降序，使用。我们希望将其扩展到预测短语(多个单词)，而不是单个单词。然而，当我们预测一个短语时，我们宁愿不显示它的前缀。例如，考虑输入the cat。在这种情况下，我们希望做出类似于the cat in the hat的预测，而不是the cat in &而不是the cat in the。假设：我们无法访问过去的搜索统计数据。我们没有标记的文本数据(例如，我们不

浏览 4提问于2017-03-22得票数 10

5回答

从句子中提取食物

algorithm、nlp

给出一句话：我早餐吃了花生酱果冻三明治和一杯咖啡。我想从中提取以下食物：花生酱果冻三明治咖啡到目前为止，使用POS标签，我已经能够提取个别的食品，即花生酱，黄油，果冻，三明治，咖啡但是就像我说的，我需要的是花生酱和果冻三明治，而不是单独的产品。有没有办法做到这一点，而没有一个数据库或数据库的食品在后端？

浏览 10提问于2017-05-11得票数 18

1回答

如何使用corenlp提取python的句法特征？

python、nlp、stanford-nlp

我想从一个句子中提取句法信息。我试过的是 corenlp_dir = "/home/corenlp-python/stanford-corenlp-full-2013-11-12/" parser = corenlp.StanfordCoreNLP(corenlp_path=corenlp_dir) result_json = json.loads(parser.parse("I am Alice.")) #pprint.pprint(result_json) for sentence in result_json["sentences"]:

浏览 1提问于2014-11-05得票数 3

1回答

清洁架构中用例类的java命名约定是什么？

java、naming-conventions、clean-architecture

java类的命名约定是使用名词而不是动词。但是在干净的架构中，用例类包含动词。我们可以在服务层/业务层中使用java类名中的谓词吗？

浏览 3提问于2019-11-01得票数 1

回答已采纳

3回答

如何使用Open nlp的组块解析器提取名词短语

java、nlp、stanford-nlp、opennlp

我是自然语言处理的新手，我需要从text.So中提取名词短语我已经使用了open nlp的组块解析器来解析我的文本，以获得树structure.But我无法从树结构中提取名词短语，open nlp中是否有任何正则表达式模式，以便我可以使用它来提取名词短语。下面是我使用的代码 InputStream is = new FileInputStream("en-parser-chunking.bin"); ParserModel model = new ParserModel(is); Parser parser = ParserFactory.create

浏览 0提问于2013-02-05得票数 13

回答已采纳

4回答

斯坦福CoreNLP中实体间关系的提取

nlp、stanford-nlp

我想使用斯坦福CoreNLP (或者其他工具)提取两个实体之间的完整关系。例如： Windows比Linux更受欢迎。这个工具需要Java。足球是世界上最受欢迎的运动。最快的方法是什么？这方面的最佳做法是什么？提前感谢

浏览 7提问于2012-12-15得票数 13

回答已采纳

1回答

机器学习-与前一句相关的检查和分析语句

machine-learning、nlp、artificial-intelligence、named-entity-recognition

在自然语言处理过程中，判断当前句子是否有“线索”的逻辑应该是什么?这需要在分析时从前一句中提取出来。我不知道如何恰当地描述这个问题，或者NLP的哪个子主题被称为NLP，所以我想举一个例子。如果前一句是Find me an Italian restaurant in New York city 现在的句子是What's the weather there tomorrow 解析器应该如何理解当前句子中的there指的是前一句中提到的New york。 PS -我对NLP相当陌生，所以请在这里解释一下。

浏览 2提问于2017-01-21得票数 3

回答已采纳

1回答

Google Cloud NLP -未返回任何实体

nlp、google-cloud-platform、entity

我们在Google NLP服务上遇到了一些问题。该服务断断续续地拒绝在某些期限内返回实体。我们使用NLP annotate API对调查答复进行自由文本回答。最近的一个问题与英国一位名叫齐皮的儿童电视角色的形象有关。下面是一些示例响应。不幸的是，我们有数千个这样的回复，但没有一个检测到"zippy“作为一个实体。奇怪的是，"elmo“、"zippie”和其他字符没有任何问题，只有这组特定的字符集("zippy")返回时没有实体。你知道为什么会这样吗？ { "sentences": [{ "text": {

浏览 22提问于2018-02-01得票数 0

1回答

关系词性标签/解析树的NPM包？(即识别主语和宾语，而不仅仅是名词/动词/形容词)

node.js、npm、nlp、pos-tagger

我正在做一个项目，在这个项目中，我从Esports Wiki上抓取球员转会、团队变更等。我已经可以分离出像"Sizz加入NRG Esports作为教练“这样的字符串，我想从这个字符串中识别出球员、团队和事件的类型。这些字符串的表达很简单，但并不总是一致的，例如，"team drops player“或"player leaves”应该导致相同的事件被解析。有时，一个字符串还会包含多个事件，所以我不能使用关键字或类似的东西。我正在寻找的是一些东西，它将接受一个句子，并吐出一个带有关系词性标记的解析树，如下所示： ? 或者，以文本形式： ( (IP-MAT (N

浏览 12提问于2020-03-29得票数 1

1回答

SpaCy，如何创建一个模式来匹配通过SpeechRecognition捕获的字符串？

python、spacy、speech-to-text

第一次来这里求救，希望一切都清楚！事实:我正在为角色扮演游戏(GURPS)构建一个应用程序(GURPS)，它跟踪玩家对敌人造成的伤害。App本身做得很好，我用PySimpleGUI作为图形界面。下一步，是集成声乐命令，以便输入输入不是从键盘，而是从声音(因为有几个输入，所以，为什么不呢？)因此，我使用SpeechRecognition库来捕获语音输入，创建一个字符串变量来存储来自用户的输入。现在我正在做第二部分的工作:从字符串中提取输入。最后一部分是将这些输入存储到字典中，并将其用作函数的输入。我想要达到的目标是，我在设计与SpaCy匹配的时候遇到了很多问题。因为我认为没有数据库可以为我的任

浏览 2提问于2021-07-17得票数 2

回答已采纳

1回答

我们什么时候从文本中提取动词短语？

nlp、machine-learning

我遇到了大量关于从文本中提取名词短语的材料。名词短语被定义为由可选的JJ修饰的相邻的NN/NNS/NNP/NNPS。很容易注意到，提取名词短语是为了获得关于文本全部内容的感觉，且可以生成单词的标签/云，或者显示文本语料库的名词短语的分布。另一方面，需要提取动词短语的场景是什么？存在哪些业务问题，需要提取动词短语？谢谢Abhishek S

浏览 2提问于2011-09-14得票数 2

回答已采纳

1回答

如何使用weka从文本参数中提取关键字

weka

我正在做一个“从文本参数中提取关键短语”的项目。为此，我首先输入清理，然后使用斯坦福解析器(POS标记)确定候选短语列表(总共约300个)。然后我计算了每个短语的特征值。我在数据集中的每个文档上都遵循了这些步骤。现在我该怎么做，即..，如何使用WEKA来查找关键词组。如何在weka中存储短语和特征值(TFX下手)。如何找到最终项目的效率？？

浏览 5提问于2013-11-15得票数 0

回答已采纳

2回答

最佳开源/免费NLP引擎

nlp

假设我有一串众所周知的短语，比如：{“我爱你”，“你的母亲是一个.”，“我想我怀孕了”……让我们来说说1000这样的话吧。现在，我希望用户在文本框中输入免费的文本，并放入某种NLP引擎来消化文本，并从“拉”中找到与文本相关的10个最相关的短语。我认为最简单的实现可能是从文字上看。每次挑选一个单词，并寻找相似之处。不知道哪一个？最让我害怕的是我必须支持的词汇量。我是某种演示的开发人员，我不喜欢在桌子上填写单词的想法. 我正在寻找一个免费的NLP引擎。我不知道它是用哪种语言写的，但它必须是免费的--而不是某种通过API调用收费的在线服务。

浏览 3提问于2013-09-16得票数 5

回答已采纳

1回答

从prolog列表中提取单词

list、prolog

我被安排了一个用Prolog进行自然语言分析的任务。到目前为止，我的程序在一定程度上是有效的。它将打印一句话，例如，如果我输入一个[the, cat, sat, on, the, mat]列表，它将正确输出： (noun_phrase(det(the), np2(noun(cat))), verb_phrase(verb(sat), pp(prep(on), noun_phrase(det(the), np2(noun(mat)))))) 我要做的下一个任务是从句子中提取关键字，即提取名词短语中的名词，动词短语中的动词和动词短语中的名词，这样我就可以返回一个列表：[cat, sat, mat

浏览 0提问于2011-04-05得票数 0

回答已采纳

1回答

如何使用SImpleNLG服务器实现所有格代词？

xml、simplenlg

我的XML如下所示： <Request> <Document cat="DOCUMENT"> <child xsi:type="NPPhraseSpec" PERSON="FIRST"> <head cat="NOUN"> <base>hand</base> </head> <spec xsi:type="WordElement" cat="PRONOUN

浏览 4提问于2020-09-23得票数 0

1回答

我有一个数据集，我想使用NLP在其上进行短语提取，但我无法这样做？

machine-learning、nlp、artificial-intelligence、nltk、word2vec

如何使用数据集从句子中提取短语，该数据集包含句子的某些集合和相应的标签，格式为 Sentence1:I want to play cricket Label1: play cricket Sentence2: Need to wash my clothes Label2: wash clothes 我曾尝试将分块与nltk一起使用，但我不能将训练数据与分块一起使用。

浏览 2提问于2019-12-29得票数 0

2回答

识别某一方言中的一般短语

nlp、nltk、opennlp

我正在寻找一种算法或方法，可以帮助识别具有特定方言的文本语料库中的一般短语(它来自特定的领域，但就我的情况而言，是英语方言) --例如，下面的片段可能来自与“世界”或“魔兽世界”相关的更大的语料库，或者可能是MMORPHs。玩家在第三人称或第一人称视野中控制游戏世界中的角色化身，探索风景，对抗各种怪物，完成任务，并与非玩家角色(NPCs)或其他玩家交互。与其他MMORPG类似，魔兽世界要求玩家支付订阅费，要么购买预付费的游戏卡，选择一定的播放时间，要么使用信用卡或借记卡定期支付。作为上述产出的一部分，我想指出以下一般短语：第一人称魔兽世界预付费游戏卡借记卡

浏览 1提问于2013-09-09得票数 1

3回答

java中有没有拆分德语复合词的工具？

java、string、text-processing、tokenize

我使用StringTokenizer成功地将句子拆分成单词。有没有工具可以把像Projektüberwachung这样的复合词拆分成Projekt和überwachung，甚至拆分复合词的原因是我想做一个文本提取。我想把像这些Projektplanung und -überwachung这样的短语转换成Projektplanung和Projektüberwachung两部分。拆分复合词是我的第一步。

浏览 0提问于2011-08-27得票数 2

回答已采纳

2回答

php/regex -从文本中提取专有名词

php、regex

我想从使用PHP regex的文本中提取专有名词(例如迈克尔杰克逊)，但我的正则表达式是不正确的。案文如下：我的朋友迈克尔·杰克逊是流行音乐之王。这张游戏专辑卖得很少。我想要的：一种能提取多个词的专有名词的正则表达式，如迈克尔·杰克逊或游戏专辑。我的审判官： /(?<=\s)([A-Z][a-z]+).*(?=\s)/ 谢谢。 P.S.通过移动设备发送。如果格式不好，请表示歉意。

浏览 1提问于2011-09-30得票数 2

1回答

存储全名的空间

python-3.x、nlp、spacy

使用spacy来标记化抓取的推文。我知道我们可以根据词性进行过滤。我正在过滤专有名词，但它仍然将名字和姓氏分解为两个标记。我将使用这些标记进行网络分析，因此我希望将适当的名称放在一起。这是我现在拥有的代码： uniquewords = {} for tweetzipfile in tweetzipfiles: zf = zipfile.ZipFile(tweetzipfile) for i, obj in enumerate(zf.infolist()): tweetjson = json.load(zf.open(obj)) tweetText = tweetjs

浏览 0提问于2021-03-18得票数 0

2回答

如何根据上下文从文本中提取单词

nlp、text-mining、extraction、linguistics

我想从用户提供的文本语句中提取相关单词。例如：关于“一个矩形有多少个边？”单词应该是‘矩形’，‘边’，‘多’，‘如何’。我们发现我真正想要做的是一个NLP问答系统。但现在我只想从问题中提取所需的关键字，问题的领域并不是很广泛。我遇到过各种数据挖掘工具，但不太确定它们是否真的对此有用。它们似乎有点太高级了，或者没有确切的关系。请让我知道，如果有任何工具，以满足需求，或我应该继续并尝试自己编码。请提供您认为可能有帮助的任何类型的指针。

浏览 0提问于2010-10-27得票数 1

1回答

DCG prolog测试几个句子

prolog、dcg

如果我有下面的代码，我将如何使它生成Answer= 5 and Answer2= 10?。我的目标是?- test(Data),lpsolve(Data, [Answer1,Answer2]). :-use_module(library(clpfd)). test([the, variable, X, is, five,fullstop, the,variable, Y, is, ten, fullstop]). lpsolve(Data, [Answer,Answer2]):- sentence(Answer, Data,[]). sen

浏览 0提问于2018-08-02得票数 1

回答已采纳

4回答