在Python中查找包含给定词的特定句子_如何查找句子中是否包含特定的单词_在Python中，如何查找包含特定属性的元素？ - 腾讯云开发者社区

python、nlp、spacy

使用Python，当病人被诊断为哮喘(关键字2)时，我试图找到患者的age(关键字4)。文本句子可能在这些关键字的所需序列之间包含其他单词。例如：短信：“嗨，斯蒂夫，很高兴听到你现在情况不太好！你不是一个人！I是一个轻度控制运动引起的哮喘患者，13岁的，然后经历了类似的情况，你的19岁。随机开始有问题，经过文托林像明天一样。” 预期产出: 13

浏览 1提问于2021-05-15得票数 1

1回答

我怎样才能知道一个词是否在给定的句子中？

javascript

我想知道某个词是否在给定的句子中。如果是，那么我想返回真，如果不是，那么返回假。例如：字=“大” 第一句：“汤姆是我的大哥。” 这应该会返回true。第二句：“桑德拉很老了。” 这应该会返回false。第三句：“拉尔夫是最大的。” 这应该会返回true。我怎样才能知道一个词是否在给定的句子中？

浏览 1提问于2020-02-06得票数 0

回答已采纳

3回答

我对数据挖掘并不感兴趣，但我需要一些关于聚类的想法。让我先描述一下我的问题。我有大约100份包含用户评论的数据表。我正在尝试为实例寻找描述质量的单词。有人可以说这是惊人的质量，另一个人可以说非常好的质量，现在我必须对描述这些相似句子的文档进行聚类，并获得这些句子的频率。在这里应用什么概念？我想我必须指定一些停用的单词和同义词。我对这个概念不是很熟悉。有人能给我一些详细的链接或解释吗？使用什么工具？我基本上是一个python程序员，所以任何python模块都会很感激。谢谢

浏览 2提问于2011-04-04得票数 3

回答已采纳

3回答

给出一个词，我们能用Spacy得到所有可能的引理吗？

python、nlp、spacy、lemmatization、spacy-3

输入词是独立的，而不是句子的一部分，但我想得到它所有可能的引理，就好像输入词在不同的句子中，带有所有可能的POS标签。我也想得到这个词的引理的查找版本。我为什么要这么做？我从所有文档中提取了引理，并计算了引理之间的依赖关系数。我已经使用en_core_web_sm完成了这两项工作。现在，给定一个输入词，我想返回与输入词的所有可能引理联系最频繁的引理。因此，简而言之，我想用所有可能的POS标记来复制输入单词的token._lemma行为，以保持与我计算过的引理链接的一致性。

浏览 12提问于2021-06-01得票数 3

回答已采纳

1回答

如何找到句子的相似度？

nlp、stanford-nlp

如何找到任意两个给定句子之间的语义相似度？罗恩·霍华德导演了哪些电影？罗恩·霍华德导演的电影。我知道这是一个很难的问题。但是，想请教一下专家们的意见。我不知道如何使用词性来实现这一点。

浏览 0提问于2014-11-25得票数 0

1回答

NLP提取关联词

python-3.x、machine-learning、nlp

我是NLP算法的新手。我正在使用法语的python 3。我想从属于一起的文本中提取一组单词。例如“左脚”“瓶装水”。如何找到从文本/句子中提取一组单词的规则。 (附言:我是法国人，如果我不能很好地表达自己，很抱歉) 谢谢

浏览 1提问于2018-02-22得票数 0

2回答

认知服务翻译与污秽过滤

microsoft-cognitive

问题描述我使用认知服务TranslateArray翻译我的用户评论。该服务的优点之一是我们可以使用ProfanityAction标记目标语言中的每个亵渎词。我还使用了自动语言检测，这样我就不必在发送之前识别内容了。当我得到与源语言匹配的目标语言的翻译时，亵渎就不会被标记。是否有另一个我可以/应该命中的端点，或者一个我不知道的参数，或者服务是否有可能得到改进？相应文档按照认知服务协议到达TranslateArray端点，使用包含亵渎的英语句子，并使用ProfanityAction:标记的行为：复制步骤用脏话发送英语句子翻译成fr，注意正确标记的亵渎。翻译成en，注意丢

浏览 8提问于2017-10-09得票数 2

2回答

从列表中移除至少包含x值的所有数据行

python、pandas、dataframe、dictionary

我有一个有一排排句子的Dataframe。现在，我想从Dataframe中删除所有包含字典/列表中>= x (e.g. 2 or 3)字数的句子，这些词可以看上去如下：dict = {"ice", "water", "rain"} 例如，如果x=2，我想删除句子ice and water are similar to each other，因为它有字典中的两个单词，但是没有ice melts away when it's warm，因为它在字典中只有不到两个单词。我知道我能从字典中删除包含任何单词的句子： df[~df.Sente

浏览 4提问于2021-08-08得票数 1

回答已采纳

4回答

在java中使用关键字输出句子

java、eclipse、file、keyword

我正在尝试用Java编写一个程序，它可以标记文本文件中的句子。每个标签都有一个关联的关键字数组。当且仅当句子包含一个或多个属于标签数组的关键字时，标签才应用于句子。例如，我有两个标签:错误和适应。在这些标签的数组中，我有一些词，比如Bugs，Fail等，代表错误，还有Polish，Clean up for adaption。其中一个句子将是“错误发现并修复”，它将进入故障类别，因此它将在标题错误之后输入句子，因为它包含单词“bug”。我在网上搜索了怎么做，但似乎什么也找不到。这是我创建的数组列表： String[] faults = { "Misspelle

浏览 0提问于2013-01-22得票数 1

回答已采纳

7回答

文本识别

python、algorithm、text

假设我有一个字符串列表(在我的例子中是电影名称)，现在我有了一个新句子，它包含字符串列表中的一个字符串。我怎样才能找到这个句子的哪一个字符串？例如： list_of_strings = ['20th century women', 'green is gold ', 'fire at sea'] sentence = 'Official Trailer | Green is gold - Releasing Tomorrow' 对于上述情况，解决办法应能找到含有绿色的句子是金的。请建议使用哪种算法来解决这个问题。Python中的

浏览 19提问于2016-10-11得票数 0

回答已采纳

2回答

我能用Excel函数从句子中生成一个随机单词吗？

excel、function、random

有人能在Excel中显示一个从句子中获取随机单词的函数吗？我正在做一个填补空白的练习。对于列，A1包含长的句子列表(每句位于一行)。我需要得到列B1包含列表或随机词从每个句子从A1。我找了很久了，但没有找到任何可能的东西。另外，如果可以在Excel中完成，速度要比其他的快得多。我认为。

浏览 0提问于2016-01-05得票数 1

回答已采纳

4回答

字符串索引

string、indexing、python-3.5

Python 3.5 这是我的密码： str1 = input("Please enter a full sentence: ").lower() print("Thank you, You entered:" , str1) str2 = input("Now please enter a word included in your sentence in anyway you like: ").lower() if str2 in str1: print("That word was found!") else:

浏览 0提问于2016-09-19得票数 0

回答已采纳

3回答

关于包含[]的特定句子的Grep

python、bash

我有一个python脚本，它报告一个错误在17分钟内在catalina.out中出现了多少次。一些错误包含更多信息，显示在错误后面的三行中。不幸的是，我所期待的句子包含了[]。我不想使用正则表达式进行搜索。是否有一种方法可以关闭正则表达式函数而只进行精确搜索？下面是一个句子im搜索的例子： bob: 2012-08-30 02:58:57.326错误:处理请求时发生web.errors.GrailsExceptionResolver异常: GET /bob/event 谢谢

浏览 2提问于2011-09-26得票数 1

回答已采纳

1回答

如果包含字串，则从另一个句子串中删除字串。

c、arrays、string、c-strings

我正在创建两个字符串。第一个是句子，第二个是单词。如果这个句子包含了这个词，我们就把它从句子中抹去。我试过几种方法，但如果这个词在句子的末尾，它总是给出正确的答案。 char sntc[150]; char word[30]; gets(sntc); gets(word); char temp[50]; int i=0; int index=0; while (i<strlen(sntc);) { for(; sntc[i] != '\0'; i++) { if(sntc[i] == ' ' || s

浏览 0提问于2019-05-12得票数 0

回答已采纳

1回答

如何在不缺少句点的情况下提取包含某个单词的句子

regex

使用RegEx，我试图从一篇包含“图”一词的文章中提取所有句子，我有以下内容： ((?<=^|\s)[A-Za-z0-9][^!?.]*(Figure)[^.]*(?=\.|\!|)) 在这句话中，“这一效应(Smith等人，2008年)在0.0001%的样本中见过(图1b)”，将给我“样本(图1b)”。我怎样才能修改我的代码，这样它就可以捕获小数和引用，从而从头到尾包含整个句子？

浏览 2提问于2022-10-10得票数 2

回答已采纳

2回答

遍历列表列表并计算不同列表的匹配项

python、list、loops、frequency、sentiment-analysis

我是python的新手，目前正在为我的硕士论文做情感分析。然而，我目前正在解决这个问题，我真的不知道如何解决它。我需要在字符串中找到一个包含单词BLA的句子，然后将句子中的每个单词与我的肯定词和否定词词典进行比较。如果否定的单词多于肯定的单词，计数器应该做+1。最后，我会得到这样的结果:在文件1中，有4个否定句子包含单词BLA。到目前为止，我使用正则表达式删除了所有不包含单词BLA的句子。然后，我将句子中的单词分开，并创建一个列表列表。例如，它看起来像这样： [‘我们’，‘表现不佳’，‘因为’，'of'，'BLA'，'BLA'，'is

浏览 1提问于2019-12-08得票数 0

1回答

对同一意义的域特定词/短语进行分组

classification、nlp、text-mining、feature-extraction、named-entity-recognition

我正在研究NLP方法，将可能具有相同含义的单词/短语组合在一起。例如，在“表被打破”这个句子中，可以用下面的单词/短语来代替，这个句子的意思仍然是一样的。损坏:损坏，毁坏，破碎，不适合使用，失去一条腿我想这样做的文本包含特定的领域和口语行话，所以现有的NLP解决方案可能不适合？我打算这样做，作为命名实体提取和命名实体链接之间的桥梁步骤。

浏览 0提问于2018-11-14得票数 2

2回答

VBA对单词后面的所有内容进行调整

regex、excel、csv、regex-lookarounds、vba

我有句"lorem ipsum dolor标记词诸如此类“ 我只需要后面的单词(但不包括)‘标记词’。“标记词”是句子中唯一保持不变的词。我找到了(?<=\bmarker words\s)(\w+)，它不仅在vba中不工作，而且在标记词ex之后只返回一个单词：blah，但我不知道如何将它扩展到字符串的其余部分(如果我要在Excel之外处理它)。我的研究表明，vba甚至根本不支持后面的查找，所以我被困住了。

浏览 5提问于2016-03-07得票数 2

回答已采纳

1回答

R/python:从训练句子建立模型

python、r、nltk、text-mining、tm

我想要达到的目标：很长一段时间以来，我一直在寻找一种方法，但我无法找到一种(有效的)方法来做到这一点：在考虑语序和同义词的同时，从例句中建立一个模型。根据这个模型映射一个句子，并得到一个相似的分数(从而表示这个句子在多大程度上符合模型，换句话说，适合用来训练模型的句子) 我试过什么 Python: nltk与gensim相结合(就我所能编码和阅读而言，它只能使用单词相似性(但不考虑顺序)。 R:使用tm构建了一个看起来很有希望的TermDocumentMatrix，但是它不能将任何东西映射到这个矩阵。此外，这个TermDocumentMatrix似乎考虑到了顺序，

浏览 11提问于2017-05-05得票数 0

回答已采纳

3回答

NLP提取相关短语

nlp、stanford-nlp

使用给定句子中的NLP，我可以很容易地使用核心NLP提取所有的形容词和名词。但我努力要做的实际上是从句子中提取短语。例如，我有以下几句话：这个人值得信任。这个人是不作判断的。这个人说话很好。对于使用NLP的所有这些句子，我想提取值得信任、不评判、说得好等短语。我想提取所有这些相关的词。我该怎么做？谢谢,

浏览 3提问于2017-05-17得票数 2

3回答

需要帮助进行句子分析

python

我的代码接受句子，并在句子中找到一个给定的单词。如果这个词在句子中，它需要说它已经找到了这个词，以及这个词所在的位置。如果单词不在句子中，它应该显示一条错误消息。我有这个： print("Please insert your sentence without punctuation") sentence=(input()) variable1='sentence' print("Which word would you like to find in your sentence?") word=input() variable2='

浏览 0提问于2016-11-08得票数 0

5回答

从输入获取项在列表中的位置(Python)

python、list

我有一份单子上写着单词。我想知道这个词在用户要求的句子中的位置。(我使用python)例如，如果我有一个句子："Hello world how are you doing today world?" 'World'出现在第一位和第八位。如果用户想知道单词'world'在这个句子中的位置，它会打印"The word world is in position 1 and 8"。我知道enumerate方法，但无法让它与输入或elif语句一起工作。无论单词发生多少次，我都想得到句子中任何单词的位置。

浏览 6提问于2016-01-25得票数 2

回答已采纳

1回答

IBM Watson语言翻译器中强制词汇表和并行语料库的区别

ibm-watson、language-translation

我读过关于使用forced glossary和parallel corpus的可能性，但我不太明白两者之间的区别。从Watson Language Translator文档中提供的示例中可以看出，当我们想要强调术语、短语在不同语言之间的翻译时，我们使用强制词汇表。然而，在平行语料库中，我们提供了一个句子在不同语言中的整体翻译。所以强制词汇表被用于少量的数据，还是？

浏览 4提问于2020-12-03得票数 0

回答已采纳

1回答

从一个单数句中寻找子句

python

我试图从Python中的单个给定句子中创建一个可能的子语句列表，但无法弄清楚如何做到这一点。例如： sentence_1 = 'the dog jumped around' 我想把它分成： ['the', 'the dog' 'dog jumped' 'jumped around' 'the dog jumped' 'dog jumped around' 'the dog jumped around' ]

浏览 5提问于2022-02-17得票数 -1

回答已采纳

2回答

如何在php中获取单词格式字符串的起始点和行号

php

$comment="Computer is Nice but the manufacturer **some bad word for him** i don;t lkie him)" 现在我需要的是得到坏词的行和起点(坏词的位置)，然后在坏评论表中将坏句子剪切并插入数据库，然后再把好注释插入到好注释表中，我很困惑如何做到这一点，任何php函数都能做到。

浏览 3提问于2016-02-11得票数 1

回答已采纳

1回答

建立WORD2VEC单词字典来表达情感

python、gensim、word2vec、glove

我正在使用Word2vec (Gensim，在python中)来理解句子的意思(通过句子中的每个单词)。我的目标是能够意识到句子是否表明了说话者的感受。我在哪里可以找到这种词典？例如，一本词典代表幸福，另一本则代表悲伤。谢谢

浏览 27提问于2020-04-10得票数 0

2回答

寻找不含词句子的情感

nlp、sentiment-analysis

我使用了一个代码来获得(意为好的、坏的、平均的)任何句子的，方法是将形容词词与我预先定义的好、坏、普通词集、句子中的一组坏词、一组平均词相匹配。但是对于否定句(包含“not”的句子)，我无法从代码中为包含不包含的句子指定确切的意义(无论是好的还是坏的)。例句：“鲍勃是学校最好的男孩。”因为在这个句子中有一个形容词“最佳”匹配好的集合，而不是好的感觉分配给这个句子。但是，对于否定句--“鲍勃不是学校里最好的男孩”。因为在这句话中只有一个形容词“最佳”与好集匹配，而不是给这个句子分配好的意义。但是在这里，" not“是有意义的，但我的代码不能在句子中处理"not"。帮

浏览 0提问于2018-08-30得票数 0

1回答

Scala:创建基于句子的每个单词的同义词的所有可能的排列

arrays、scala、combinations

我有一个句子(字符串)和一个函数，它从WordNet生成给定单词的所有同义词。我想根据我的句子的同义词，列出所有可能的变体。此外，我还想保持原句的顺序，意思排列应该只包含第一个词的同义词作为第一个词，第二个词的排列作为他们的第二个词等等。例如，如果我的输入是： "5 centimeters" 我的产出应该是： 5 cm 5 centimetres 5 centi-meters 5 centi-metres five cm five centimetres five centi-meters five centi-metres 在Scala中进行此操作的最佳方法是什么？谢谢!

浏览 0提问于2019-01-23得票数 1

回答已采纳

4回答

循环计数器比较两个列表

python、list、while-loop、counter

我需要帮助。我有两份清单如下： sentences = ['The green monkey green age the blue egg','How many yellow green monkey"s are in the green forest'] color =['orange', 'green', 'yellow', 'violet', 'blue'] totals = [] for sent in sentences: print sent for

浏览 7提问于2013-12-19得票数 2

回答已采纳

3回答

根据一组文档中的相似度对句子进行排序的最佳方法

string、algorithm、similarity

我想知道从一组文档中根据相似度对句子进行排序的最佳方法。例如，假设，以文档1为主要内容的5个documents.Each文档包含多个sentences.Lets，即输出将包含来自该文档的句子的列表应该是所有5个文档中排名最相似的句子列表，第一个排序的句子是所有5个文档中最相似的句子，然后是第二个，然后是第三个... 提前谢谢。

浏览 0提问于2012-01-04得票数 0

回答已采纳

1回答

提取包含法语单词"mais“返回句的不包含的句子

python、python-3.x、list、list-comprehension、dictionary-comprehension

早上好, 我试图从文件中提取包含"mais“一词的句子，但我遇到的问题是，提取出来的句子根本不包含"mais”，有时包含"jamais“。你知道为什么吗？我举了一个小例子来说明我的问题？如下所示:我写的脚本使用了空格来标记句子，所以我只是举例说明了一小部分。这些行跟随读取文件并将其放入列表的行。然后在列表中循环找到包含"mais“的elt。 sentences_list_num = ['je ne suis pas mauvais mais lourd','je ne suis pas gentil', 'ce

浏览 1提问于2020-05-11得票数 0

回答已采纳

2回答

Regex捕获短语，加上单词前面和之后的单词

python-3.x、regex、python-re

使用Python，我试图在一个返回中捕获一个短语，加上前面的单词和一个接一个单词。也就是说，从句子中..。 We want to see this phrase here and then again! 返回 see this phrase here 我最近得到的是..。 >>> s = 'We want to see this phrase here and then again!' >>> re.search("\w*\sthis phrase\w*\s",s) <_sre.SRE_Match object; sp

浏览 0提问于2021-07-22得票数 1

回答已采纳

1回答

使用wordnet查找具有6种基本情感的句子的相似度

nltk、wordnet、emotion、senti-wordnet

我正在做一个项目，其中一部分需要检测我们处理的文本的情感。例如, 他很高兴回家。我将从上面的句子中提取两个单词，即happy和home。我会有一张包含6种基本情绪的表格。(快乐，悲伤，恐惧，愤怒，厌恶，惊讶) 这些情绪中的每一个都将有一些与它们相关联的同义词。我需要找到这些同义词和快乐这个词之间的相似度，然后再找出这些同义词和家这个词之间的相似度。我试着使用WORDNET来达到这个目的，但是我不能理解wordnet是如何工作的，因为我还是个新手。

浏览 6提问于2016-01-23得票数 0

1回答

段落向量为每个段落生成多少个向量？

neural-network、nlp、deep-learning、word2vec、word-embeddings

例如，如果我有一个有两个段落的语料库，那么段落向量会产生两个向量吗?另外，对于句子和文档的分布式表示(Q. Le，T. Mikolov)，我不明白为什么段落向量在段落之间是唯一的，但是单词向量是共享的。为什么？

浏览 0提问于2016-11-16得票数 0

回答已采纳

1回答

复字符串匹配

java、artificial-intelligence、string-comparison、string-matching

在Java中，我使用Levenshtein (apache )尝试将一个诸如对象的列表与另一个“几乎完美”的列表相匹配。几乎被打磨过的东西包括：面包螺丝刀螺丝番茄书番茄汁半苹果绿色苹果苹果另一个大列表可以包含与上面相同的单词，但也包含其他一些词，因为它可以是句子的一部分，也可以是特定的项目(例如。一个绿色苹果的四分之一或一本关于编程的旧书)。此列表中的项已编入索引，并属于特定的框。这是一个数据库表，其中的项是索引的。我想要做的是把大清单上的物品和“打磨”的清单联系起来。喜欢四分之一的绿色苹果=>苹果一本稍微用过

浏览 3提问于2014-05-02得票数 0

回答已采纳

1回答

我想用弹性搜索

elasticsearch

我想用弹性搜索假设弹性搜索引擎有包含键和值的数据。关键是单词。这个值是一个实体列表。例如，键:apple，value:水果，公司当我发送一个由句子组成的查询时。这个句子可以有几个候选关键字。因此，我的问题是，该功能是否在弹性搜索中，为单个查询中的每个候选关键字提供结果。 (前) 质疑：“什么是苹果派”候选关键词：“什么是苹果”，“是什么”，“是苹果”，“苹果”，“苹果派”，“派”存在于DB中：" apple "，“苹果派”，“饼”返回的结果："apple“：水果，company，"apple饼”：食品，“馅饼”：食品。谢谢。

浏览 0提问于2019-02-12得票数 0

回答已采纳

2回答

在C#中使用函数统计禁用词数

因此，我一直在尝试让这个脚本工作，但这是一个痛苦的背后。基本上，我想检查句子，看看它是否包含禁用的单词。如果一个给定的句子包含3个以上的单词(等于或更多)，那么我希望它告诉我，这样我就可以发送警报。到目前为止，我所拥有的： public bool CheckSentence(string Message) { var count = 0; foreach (WordFilter Filter in this._filteredWords.ToList()) { if (Message.Contains(Filt

浏览 4提问于2016-12-27得票数 0

1回答

如何为词汇简化数据集选择目标词

machine-learning、nlp、dataset

我正在试图编译一个词汇简化数据集，其中包含句子、目标词及其更简单的替代词。我已经在各种语言中找到了一些类似的数据集，以下是一些可供参考的数据集：英语 -每个句子包含一个目标词西班牙语 -每个句子包含多个目标词西班牙语 -每个句子包含多个目标词英语 -每个句子包含一个目标词然而，这些来源似乎都没有说明目标词是如何选择的。目标词是潜在的复杂词，这意味着它们可能被贴上复杂或不复杂的标签。他们是任意选择的吗？这一过程通常如何进行？提前感谢！

浏览 0提问于2022-12-14得票数 1

1回答

重复句对Word2Vec有影响吗？

machine-learning、nlp、word2vec、word-embeddings

我正在使用面向域的文档，以便使用Word2Vec获得同义词。这些文档通常是模板，所以句子经常重复。单句中的1k占文本语料库的83%，而独特句子中的41k占语料库的17%。这种不平衡的句子频率会影响我的结果吗？我应该分样本最常见的句子吗？

浏览 0提问于2019-11-06得票数 1

回答已采纳

1回答

在kibana中查找不包含指定字段的日志

search、kibana、elastic-stack

我使用ELK来整理我的日志，日志来自许多地方，有些记录可能不包含几个字段，问题是找到这些记录的最佳方法是什么？是否可以找到不包含多个字段的日志？

浏览 397提问于2015-08-19得票数 0

1回答

gensim word2vec词嵌入如何为一个词句提取训练词对？

nlp、text-mining、gensim、word2vec、word-embedding

请参考下面的图片( word2vec跳过图如何从输入句子中提取训练数据集的过程)。例如：“我爱你。”==> (我，爱)，(我，你) 如果这个句子只包含一个单词，我可以问一下这个词对是什么？是“快乐！”==> (快乐，快乐)吗？我对word2vec算法进行了基因测试，当训练集中只有一个词时(而这个词不包含在其他句子中)，word2vec算法仍然可以为这个特定的词构造一个嵌入向量。我不知道这个算法是如何做到的。 ===============UPDATE=============================== 正如下面发布的答案，我认为为1字句子中的单词创建的单词

浏览 1提问于2020-06-05得票数 0

回答已采纳

3回答

每种语言的谷歌词典？

google-search

当我们将单词/句子翻译成另一种语言时，我们正在使用谷歌翻译。但是，如果我想查找一个词在我自己的语言或英语中意味着什么呢？有谷歌字典吗？

浏览 0提问于2010-10-06得票数 4

1回答

如何将两个预先训练过的Word2Vec模型结合起来？

java、nlp、emoji、word2vec、deeplearning4j

我成功地在Word2Vec上学习了Word2Vec教程，所以我能够加载已经受过训练的模型，或者根据一些原始文本来训练一个新的模型(更具体地说，我使用的是GoogleNews-vectors-negative300和Emoji2Vec预培训模型)。但是，我想将这两种模式结合起来，原因如下:有一个句子(例如Instagram或Twitter的评论，其中包含表情符号)，我想识别句子中的表情符号，然后将其映射到与其相关的单词。为了做到这一点，我计划对句子中的所有单词进行迭代，并计算贴近度(表情符号和单词在向量空间中的位置有多近)。我如何对已经存在的模型进行升级。然而，在这种情况下，没有添加新单词，

浏览 0提问于2018-03-23得票数 0

回答已采纳

2回答

用JavaScript计数字符串中的句子

javascript、regex、string、count、coffeescript

已经有几个类似的问题：我的情况有点不同。我需要计数字符串中的句子数。最接近我所需要的答案是： str.replace(/([.?!])\s*(?=[A-Z])/g, "$1|").split("|") 这里唯一的问题是，这个RegEx假设一个句子以大写字母开头，而大写字母可能并不总是这样。更确切地说，我将把一句定义为：从字母(大写与否)、数字甚至符号(如美元或欧元)开始。以标点符号结尾，如“.”、“？”或者是“！” 但是，如果一个句子包含一个数字，它本身就包含一个“。或者是"，“，那么这个句子应

浏览 0提问于2016-02-05得票数 5

回答已采纳

3回答

在java的字符串中查找特定单词的Regex

java、regex

我需要一些正则表达式的帮助:我正在检查一个句子是否包含一个特定的单词。让我们以本主题的标题为例： “在字符串中查找特定单词的Regex” 我需要找到它是否包含单词 if ，在本例中它是假的。我不能使用包含的方法，因为在本例中它将返回true (spec*if*ic) 我正在考虑使用匹配的方法，但我有点不喜欢正则表达式。基本上，匹配方法输入的正则表达式需要指定我要查找的单词之前的字符和单词后面的字符不是字母(因此不能包含在该单词中)，或者该单词位于句子的开头或结尾。非常感谢!

浏览 1提问于2013-08-17得票数 4

回答已采纳

1回答

如何使用python为密钥找到一个好的分配器？

python、machine-learning、nlp、artificial-intelligence

我想做的是创建一个多重选择问题(MCQ)的代名词来填补空白式的问题生成器。我需要从键(正确的答案)中产生干扰(错误的答案)。MCQ是由用户输入的教育文本生成的。我们试图通过结合上下文的相似性，键和干扰物发生在其中的句子的相似性和术语频率的差异来解决这个问题，有帮助吗？我正在考虑使用大数据集来生成相关的分配器，比如google提供的那些，我不知道如何在python中实现这一点。

浏览 2提问于2016-12-04得票数 1

回答已采纳

1回答

为什么用求和而不是平均来分析情绪呢？

machine-learning、sentiment-analysis

在“情感分析”中，我看到了整串词(推文、段落、句子等)的情感。通过对字符串中所有术语的情感求和来计算的。我知道求和和平均之间有一种单调的关系。所以，如果句子和其他句子相比的话，那当然不会有什么区别。那麽，为何不以平均数代替和呢？特别是在某些情况下，字符串只能包含一个词或多个词，在我看来，一般的情绪才是最好的选择。这不是真的吗？

浏览 0提问于2015-09-24得票数 3

3回答

自然语言处理包

nlp、stanford-nlp

我已经开始从事一个需要自然语言处理的项目。我们已经做了拼写检查，以及将句子映射到短语及其同义词。我首先想到使用GATE，但我不知道该使用什么？我在这里发现了一个有趣的帖子，这让我更加困惑。请帮我决定什么最适合我的目的。我正在工作的web应用程序，这将使用此NLP工具作为服务。

浏览 1提问于2010-03-05得票数 5

回答已采纳

2回答

用Python提取包含一个单词的句子..。以及它周围的句子？

python、regex、nlp、nltk、text-segmentation

在提取包含一个单词的特定句子(如和)时，有很多问题，而且我有足够的初学者经验，可以自己完成NLTK和SciPy的操作。然而，我被困在试图提取一个包含一个词的句子..。以及目标句子前后的句子。例如： “前几天，我正往学校走去，天开始下雨了。我伸手拿起雨伞，但我意识到我忘了在家。我能做些什么呢?我马上就跑到最近的那棵树上。但后来我意识到，我不能在没有叶子的情况下继续尝试一棵树。” 在这个例子中，目标词是“the”。如果我想提取目标句子(我能做什么？)以及前面和后面的句子(我伸手拿起我的伞，但我意识到我在家里忘了它。)我立刻跑到最近的一棵树上。)，什么是好的方法？假设我把每一段都分割成自己的文

浏览 4提问于2014-05-22得票数 2

回答已采纳

5回答