仅在句子的STOP、stop或StOppp上匹配秒词 - 腾讯云开发者社区

、

所以问题是，我需要一个正则表达式，它将匹配第二个单词，如果它的stop，这也意味着后面跟着一个空格的stopp或sstoooppp。我需要得到那个词，我找不到任何正则表达式来做这件事，因为我找到了像这样的正则表达式，它完成了一半的工作，就是这个 \b[STOP]+\ \b|\b[stop]+\ \b 但问题是它不匹配句子的第二个单词，它匹配包含stop的所有内容。另一个问题是它匹配to，因为它的t后面跟着o，所以它匹配任何帮助

浏览 19提问于2019-07-17得票数 0

回答已采纳

2回答

Java中基于字典的搜索优化

、、

我有一个Sentences课程。该类的实例表示文本文件中的每个句子。我正在阅读文件中的每个句子，并使该句子成为我的instance类的Sentences。对于每个句子，我需要检查其中有多少个停止词/虚词。我有一个文本文件(stopwords.txt)，其中包含英语停止词。我应该如何设计我的程序，这样我就不必一遍又一遍地读stopwords.txt文件。相反，我应该保存这个文件的内容(停止词)保存“某种方式”，然后检查我句子中的哪个单词是停止词。我有这么多的句子，所以我需要这个程序尽可能快。编辑：我创建了一个StopWords类 public class StopWords 我在这个

浏览 5提问于2015-01-26得票数 0

回答已采纳

5回答

雷吉斯？匹配部分或全部单词

、

我想知道是否可以使用regex和python来捕获一个单词，或者这个单词的一部分(如果它在字符串的末尾)。例：目标词-土豆 string -“这是一个关于土豆的句子” 字符串--“这是一个关于的句子” string --“这是关于pota的另一个句子” 谢谢!

浏览 5提问于2012-11-15得票数 1

回答已采纳

3回答

Regex帮助-搜索和替换

以下是我需要搜索和替换的单词的组合： [Cc]ontestants: [Cc]ontestants : [Cc]ontestant: [Cc]ontestant : 跟踪正确吗？ '/[Cc]ontestant(:| :|s:|s :)/' 该句子(或行)将以单词开头，并以：(在:之前是否有空格)结尾，后面跟着句子中的其他一些单词，或在:之后没有单词。只需要匹配和替换上面的组合，用一个新的词- say MyWord。谢谢。

浏览 4提问于2016-05-20得票数 0

回答已采纳

1回答

将一个小数据集与大型数据集进行比较，以获取类似的记录。

、、、

我创建了一个不同的小数据集( dataset : X)，每个查询中有500个记录。每次我需要比较数据集和更大的数据集(数据集: A) (15毫秒记录)，以便从三个不同的列中找到相似的(或半硅)值。这些值要么是一个单词，要么是一个句子。我的算法是这样的：在两个数据集中的每个记录中创建一个单词向量。使用for循环，在大型数据集上搜索相似之处(例如，使用tfidf)。这意味着来自小数据集的每条记录都应该在大数据集上寻找可能的相似之处。然而，问题是搜索大数据是非常缓慢的。有什么有效的办法解决这个问题吗？谢谢

浏览 0提问于2020-02-20得票数 3

回答已采纳

1回答

如何使用regex从字符串中提取和替换特定的模式？

、

我知道这个问题已经在堆栈溢出上问过很多次了，但是regex太难理解了。我试过的是： String sentence = "The #{adjective} brown fox jumps over the lazy dog"; String requierd_sentence = sentence.replaceAll("[{*.*}]", "quick"); System.out.println(requierd_sentence); 在这个句子中，形容词不是固定的--它们随每一个新的字符串/句

浏览 1提问于2014-06-17得票数 2

回答已采纳

1回答

星号和加号定义问题

我开始阅读Regex，在文章中我发现： The asterisk or star tells the engine to attempt to match the preceding token zero or more times. 和 The plus tells the engine to attempt to match the preceding token once or more 我在谷歌上搜索了上述句子的含义，但我真的不明白preceding token once or more和preceding token zero or more times这两个词是什么意思，有人可以

浏览 2提问于2015-12-27得票数 0

回答已采纳

2回答

匹配内部没有连字符的单词

、

我需要一个正则表达式，允许在他们里面没有连字符的单词。例如，在字符串“非单词句子”中，它应该只与“句子”匹配。我写道： "\b(?!\w+[-]\w+)\w+" 它失败了：它不仅匹配“句子”，也匹配“单词”。如何让它忽略内含连字符的单词？

浏览 4提问于2013-07-11得票数 1

2回答

根据单词在文本中的位置从字符串中过滤特定单词

、、

我有几个词性规则，只有当正在查看的文本与规则匹配时，才会触发它们。然而，我很好奇是否有一种方法可以删除出现在短语之间的“任何”单词，否则就会触发规则。我尝试使用停用词，但它将文本剥离得太多，以至于规则变得毫无意义。这里有一个例子。 Text: I want to attack this player's base. attack_rule = [ ('nn', 'i'), ('vbp', 'want'), ('to&#

浏览 8提问于2019-10-29得票数 0

2回答

句子中的实体检测在训练和测试中的不同

、、

在训练短语时，实体检测工作良好，即在增加句子作为训练样本时突出显示感兴趣的单词(实体)，但是当测试相同的句子时，没有选择这些实体。如果我们看看附在一起的例子物业价格在培训期间自动选择，但在测试期间为空/未检测到。

浏览 6提问于2019-02-06得票数 1

回答已采纳

4回答

从例句列表中找出具有相似相关含义的句子

、、

我希望能够找到具有相同含义的句子。我有一个疑问句，以及数百万个其他句子的长长列表。句子是单词，或者是一种被称为符号的特殊类型的单词，它只是一种表示正在谈论的对象的单词类型。例如，我的查询语句是：示例:将(x)与(y)相加(z) 我的数据库中可能已经有一个句子列表，例如: 1. (x)和(y)的和是(z) 2. (x)加上(y)等于(z) 3. (x)乘以(y)不等于(z) 4. (z)是(x)和(y)的和这个例子应该匹配我的数据库中的句子1，2，4，但不是3。另外，句子匹配应该有一些权重。这不仅仅是数学句子，任何句子都可以根据单词的意思与其他句子进行比较。我需要一些方法来比较一个句子和

浏览 2提问于2011-05-01得票数 4

回答已采纳

3回答

根据一组文档中的相似度对句子进行排序的最佳方法

、、

我想知道从一组文档中根据相似度对句子进行排序的最佳方法。例如，假设，以文档1为主要内容的5个documents.Each文档包含多个sentences.Lets，即输出将包含来自该文档的句子的列表应该是所有5个文档中排名最相似的句子列表，第一个排序的句子是所有5个文档中最相似的句子，然后是第二个，然后是第三个... 提前谢谢。

浏览 0提问于2012-01-04得票数 0

回答已采纳

1回答

Python :寻找更高效的正则表达式

、

我正试着从10k的声明中提取每家公司的消费者数据。我的具体目标句是 (例如)“消费者A，消费者B占销售额的~”。然而，这个句子有很多变体。有几点需要考虑，考虑到所有这些变体。例如，“帐户”可以是“帐户”\“会计”\“代表”\“代表”(此外，如果“表示”出现，目标句子中不应该有" for“)。销售可以是销售收入\收入因为，公司名称有时出现在该目标句之前/之后的1或2个句子。在此之前/之后，我想同时提取目标句+2句。然而，一些公司名称中包含"."，如“丰田公司”和“美国国防部”。因此，如果我试着在这个目标句之前提取两个句子(“丰田公司，占销售额的

浏览 0提问于2017-09-08得票数 0

4回答

在wordcloud中，除了默认的停止词之外，如何添加额外的停止词？

、、、、

我想在wordcloud中使用的默认停止词列表中添加某些单词。当前代码： all_text = " ".join(rev for rev in twitter_clean.text) stop_words = ["https", "co", "RT"] wordcloud = WordCloud(stopwords = stop_words, background_color="white").generate(all_text) plt.imshow(wordcloud, interpolation='b

浏览 0提问于2019-01-01得票数 5

回答已采纳

1回答

用于匹配短语和中间单词的PhraseMatcher

假设我有以下两句话："Onions are being cut. However, a great big cut to the onions have been observed"，我希望匹配短语“切洋葱”。这只是一个最小的例子。我的要求是，算法遍历所有句子，并返回一个bool，即句子是否包含该短语。另外，我只希望匹配词汇化的版本，在短语之间有0个或更多的单词是可以的。因此，在上面的示例中，我希望它返回[False, True]。我该怎么做呢？我的半个尝试如下(我需要帮助的地方被标记为TODO)： import spacy from spacy.matcher imp

浏览 40提问于2020-04-17得票数 2

回答已采纳

1回答

在python中对整个句子进行修饰是行不通的。

、、、、

我在python中的NLTK包中使用WordNetLemmatizer()函数来对电影评论数据集的整个句子进行修饰。这是我的代码： from nltk.stem import LancasterStemmer, WordNetLemmatizer lemmer = WordNetLemmatizer() def preprocess(x): #Lemmatization x = ' '.join([lemmer.lemmatize(w) for w in x.rstrip().split()]) # Lower case x = x.lo

浏览 1提问于2019-02-23得票数 1

回答已采纳

1回答

标记句子以删除停止词:停止词未被移除

、、

下面的代码应该从数据库中取出一个句子，然后用word标记它，然后相应地删除停止词。由于某些原因，当我在For循环中调用远程脚本函数时，它无法工作。有什么建议吗？当我用插入的句子调用移除词函数时，它工作得很好。 import nltk import random import csv from nltk.corpus import stopwords def tokenize(sentence): """ This function does the task of converting a sentence into a set of words"&#

浏览 9提问于2022-11-30得票数 0

1回答

在R中使用grepl()匹配句子中的两个连续单词(或者:如何在grepl()中使用通配符)？

、

假设我想在一个句子中匹配两个连续的单词，但不显式地匹配其他句子，这些句子可能仍然包含这两个单词，但不是一个紧接着另一个。 mydata <- data.frame(text=c("I like pizza, and a read a novel.", "I like novels.")) 所以如果我这么做了..。 grepl("lik.*? novel.*?", mydata$text, perl=T, ignore.case=T) ...I得到“1true TRUE"，而我需要的是"FALSE TRUE”，因为第一句话中的

浏览 11提问于2019-07-14得票数 2

回答已采纳

2回答

要匹配整句话，但要有注释

我用这个正则表达式来标记以句号、问号或感叹号结尾的整句话--到目前为止，它是有效的。 [A-Z][^.!?]*[.?!] 但是有两个问题：如果在句子中有一个数字后面跟着一个句号。如果句子中有句号的缩写。然后，句子被错误地提取出来。示例：例句：“二锦一，十一月一日。” 例句：“Schiwago博士。” 然后，第一句变成两句，因为一个句号跟在数字后面。第二句也成为两个句子，因为缩写结束于一个时期。如何调整正则表达式，使这两个问题都不会发生？因此，在第一句中，当一个时期跟随一个数字时，这不应该被看作是句子的结尾，但是正则表达式会持续

浏览 4提问于2022-10-30得票数 2

回答已采纳

1回答

python中重叠的findall

、

我在调试一些遗留代码，发现我们没有正确使用re.findall。所以我有一组关键字(也可以是一个短语)，我需要返回一个句子中出现的所有关键字。 keyWords = [keyword1, keyword2,...] # size around ~500 prog = re.compile(r'\b(%s)\b'%"|".join(keyWords)) # has to match the entire word, hence the word boundary \b prog.findall(sentence) 但它在以下情况下不起作用： myKeywords

浏览 0提问于2018-07-10得票数 0

1回答

有什么有效的解决办法从给定的句子中提取关键短语吗？

、、、

我正试图用TF-国防军模式从给定的句子中提取一个关键短语.为了做到这一点，我试着在句子中找出候选词或候选短语，然后在句子中使用get频繁词。然而，当我引入新的CFG规则来查找句子中可能的关键短语时，我有错误。这是我的剧本： rm_punct=re.compile('[{}]'.format(re.escape(string.punctuation))) stop_words=set(stopwords.words('english')) def get_cand_words(sent, cand_type='word', remove_pun

浏览 1提问于2018-12-01得票数 2

6回答

确定一个句子是否包含一个特定的词

、、

我想知道如何在标签中引用句子中的一个词。例如，我有： label1.text = "books pencil pen ruler"; 我想说：“如果标签1.文本包含”钢笔“一词，那就做点什么吧。” if (label1.text CONTAINS THE WORD "pen") { // do something } 我该怎么做？

浏览 6提问于2012-07-04得票数 6

回答已采纳

1回答

如何用regex和Julia计算除所有形式空白外的句子中的所有单词

、

我试着把句子中的所有单词匹配起来： "That's the password: 'PASSWORD 123'!", cried the Special Agent.\nSo I fled. 我试过： ([A-Za-z\d(^\n$)]+('[A-Za-z]+)?) 但我不想把\nSo和一个词相匹配。只有So。事实上，我想排除所有形式的空白，如\n或\t。我的Julia代码是： sentence = """"That's the password: 'PASSWORD 123'!",

浏览 2提问于2021-09-15得票数 2

回答已采纳

1回答

谷歌拼写检查背后的逻辑是什么？

当我想在google上搜索一个单词或什么东西时，如果那个单词或句子中有拼写错误，google可以用正确的拼写或更正的句子把我找回来。有人能解释一下这到底是怎么回事吗。如果有人能用编程来解释，而不是用数据库和所有这些东西来解释，我会很高兴的。谢谢。

浏览 0提问于2009-11-09得票数 2

2回答

如何使用regex找到一个单词？

我正在创建一个以自然语言为输入的机器人。例如，我希望从用户的输入中找到"árbol“或"carbón”的单词。它必须是不区分大小写和口音不敏感。它必须在句子的任何地方找到单词。示例： arbol -(应该检测到) caRbóN (应检测) 红葡萄酒-(应该检测到) RBOL-(应该检测) 当我想检测句子中的单词时，问题就来了。不得发生下列情况： Eso es un(不应检测) 厄尔波拉-(不应该探测) 使用regex，我有以下内容： /(á+)rb(o+)l|c(a+)rb(ó+)n|(a+)rb(o+)l|c(a+)rb(o+)n/i 我知道我必须使用\s

浏览 5提问于2017-11-01得票数 0

回答已采纳

2回答

VBA对单词后面的所有内容进行调整

、、、、

我有句"lorem ipsum dolor标记词诸如此类“ 我只需要后面的单词(但不包括)‘标记词’。“标记词”是句子中唯一保持不变的词。我找到了(?<=\bmarker words\s)(\w+)，它不仅在vba中不工作，而且在标记词ex之后只返回一个单词：blah，但我不知道如何将它扩展到字符串的其余部分(如果我要在Excel之外处理它)。我的研究表明，vba甚至根本不支持后面的查找，所以我被困住了。

浏览 5提问于2016-03-07得票数 2

回答已采纳

2回答

Regex捕获短语，加上单词前面和之后的单词

、、

使用Python，我试图在一个返回中捕获一个短语，加上前面的单词和一个接一个单词。也就是说，从句子中..。 We want to see this phrase here and then again! 返回 see this phrase here 我最近得到的是..。 >>> s = 'We want to see this phrase here and then again!' >>> re.search("\w*\sthis phrase\w*\s",s) <_sre.SRE_Match object; sp

浏览 0提问于2021-07-22得票数 1

回答已采纳

2回答

PHP Regex可选地将句子中的单词与其他特定单词匹配

、

我正在寻找一个PHP正则表达式来匹配一个句子中的一个单词，它也允许句子中的一些其他单词，但是如果句子中有任何其他单词不在允许的列表中，那么匹配就会失败。例如： The quick fox 我在找狐狸。‘'The’和'quick‘如果出现的话也是可以的。因为这些词是可选的，所以 fox 也会没事的。然而， The quick brown fox 是不好的。我不想要棕色狐狸。你也可以建议另一种方法来做这件事，但它需要快速发火。编辑:单词会出现在狐狸前面，但它们可以按任何顺序出现。 quick The fox 也应该匹配。

浏览 1提问于2015-06-19得票数 0

回答已采纳

1回答

写入文件时出现I/O问题

、、

我很难弄清楚为什么这段代码不能正常工作。我正在学习I/O操作的基础知识，我必须想出一个C程序来写一个'log.txt‘文件，当输入'stop’这个词时，程序必须停止。所以我的代码是： #include "main.h" #define SIZE 1024 int main(int argc, char *argv[]) { int fd; int readBytes; int writBytes; char *buffer; if ((fd = open("log.txt", O_WRONLY|O_A

浏览 0提问于2012-02-11得票数 2

回答已采纳

1回答

如何从SQL中的另一个表中选择包含关键字的1表中的行？

、、、、

我有两张表--一张带有句子，另一张带有关键字。我想从包含任何关键字的句子表中选择行。例如：句子我喜欢我的狗我最喜欢的食物是意大利面编程很有趣关键词最爱的食物狗我的目标是返回前2行。到目前为止，我已经： select a.* from sentences a join keywords b on a.sentences like '%' || b.keywords || '%' 但是，我得到了一个错误：“此查询的执行涉及执行一个或多个无法优化的笛卡尔产品联接”。有什么想法吗？提前谢谢。也不确定这是否重

浏览 2提问于2015-11-28得票数 1

回答已采纳

4回答

在java中使用关键字输出句子

、、、

我正在尝试用Java编写一个程序，它可以标记文本文件中的句子。每个标签都有一个关联的关键字数组。当且仅当句子包含一个或多个属于标签数组的关键字时，标签才应用于句子。例如，我有两个标签:错误和适应。在这些标签的数组中，我有一些词，比如Bugs，Fail等，代表错误，还有Polish，Clean up for adaption。其中一个句子将是“错误发现并修复”，它将进入故障类别，因此它将在标题错误之后输入句子，因为它包含单词“bug”。我在网上搜索了怎么做，但似乎什么也找不到。这是我创建的数组列表： String[] faults = { "Misspelle

浏览 0提问于2013-01-22得票数 1

回答已采纳

1回答

如果字符串列表不在其中，则获取两个字符串之间的字符串

、、

希望标题不会太混乱。我有一个目录，里面全是包含故事的文件。只有当两个句子之间的字符串不包含另一个列表中包含的任何句子时，我才需要获取两个句子之间的字符串列表(总是向前)。每个故事。因此，例如，我有一个清单“大狗”，“她去追他”，安妮咬她的嘴唇，等等。然后我有一个文件，它可能是一个故事，其中包含了谁知道什么。我想要找到"He leapt after her“和"She kissed”之间的字符串，但前提是它们之间的字符串不包含第一个列表中的任何句子，或者它们自己。我已经找到了几种方法，但大多数都很慢，几乎需要一个小时才能完成一个文件，我相信一定有更好、更快的方法。注意，我

浏览 0提问于2012-04-11得票数 0

回答已采纳

2回答

Elasticsearch同义词搜索分析器更新后没有更新synonyms.txt？

因此，我在搜索分析器中定义了一个具有同义词映射的索引。当我第一次创建索引时，这些同义词是在搜索时发现的。之后，我更新了节点上的synonyms.txt文件一次，以更新同义词映射，并在进行更改后重新启动每个节点。这导致同义词的变化反映在搜索上，尽管索引。现在，当我更改同义词文件并重新启动节点时，同义词映射并不像我认为应该更新的那样更新。我是不是遗漏了什么？我想，由于同义词映射在search_analyzer上，所以不必每次都重新编制索引来反映更改。以下是我的索引定义： PUT /synonym_index { "aliases": {}, "mappings&

浏览 0提问于2018-10-09得票数 0

1回答

在两个特定单词之间查找单词重复的正则表达式

、

我可以使用(.+)(?=\1+)找到给定句子的重复模式。但是，当我在一个句子中的两个特定单词之间尝试相同的时候，它失败了，“没有匹配”。我是不是漏掉了什么。示例： abc def def def def ghi ghi xyz 当我使用/abc (.+)(?=\1+) xyz/时，它在没有匹配的情况下失败。不想在任何有条件的偏执下加上第一个词和第二个单词。所以我希望regex语句是这种类型的/abc regex表达式def/。

浏览 2提问于2014-05-05得票数 0

回答已采纳

3回答

在java的字符串中查找特定单词的Regex

、

我需要一些正则表达式的帮助:我正在检查一个句子是否包含一个特定的单词。让我们以本主题的标题为例： “在字符串中查找特定单词的Regex” 我需要找到它是否包含单词 if ，在本例中它是假的。我不能使用包含的方法，因为在本例中它将返回true (spec*if*ic) 我正在考虑使用匹配的方法，但我有点不喜欢正则表达式。基本上，匹配方法输入的正则表达式需要指定我要查找的单词之前的字符和单词后面的字符不是字母(因此不能包含在该单词中)，或者该单词位于句子的开头或结尾。非常感谢!

浏览 1提问于2013-08-17得票数 4

回答已采纳

5回答

如何通过字符串中的单个单词匹配来提取整个句子？

、、、、

所以我得到了一个完整的字符串(大约10k个字符)，然后在该字符串中搜索一个(或多个)单词。和regex(word).Matches(scrappedstring)在一起。而是如何提取包含该单词的整个句子。我正在考虑在搜索词之后提取一个子字符串，直到第一个点/感叹号/问号/等等。但是如何提取搜索词之前的句子部分？或者也许有更好的逻辑？

浏览 0提问于2013-05-13得票数 2

回答已采纳

1回答

与部分句子匹配的正则表达式

、

我试图在否定词之后找到一个句子的一部分(例如，不要，不能，不要)，直到下一个标点符号，并在句子的每一个单词的末尾加上"_NOT“，例如：”我真的喜欢火鸡，但不喜欢带西红柿的鸡肉，因为我过敏“变成”我真的喜欢火鸡，但不喜欢chicken_NOT with_NOT tomatoes_NOT，因为我过敏“。最初，我的方法是运行regex，如下所示： (dont|cant|not)(.*)[!?,.] 要得到我感兴趣的句子的一部分，然后逐字逐句地添加_NOT，然后运行str.replace(oldPartOfSentence，newPartOfSentence)。这几乎是可行的，但搜索并不

浏览 2提问于2015-10-16得票数 1

回答已采纳

1回答

包含在另一列中列出的单词的单元格的条件格式设置

我有一个列，其中有几行单词，我想突出显示其他列中使用的单词。然而，其他列包含句子。有人知道这怎么可能吗？在本例中，A列包含了两个字，如果在B或C列的所有行中都使用了这些词，则应突出显示这些词。 A栏：香肠维纳布拉特 B栏：我喜欢香肠我不喜欢牛排 C栏：我喜欢布拉特

浏览 0提问于2017-12-29得票数 1

回答已采纳

1回答

regex -查找特定的字符串，但在某些句子中不存在。

我不确定是否可以用一条正则线。我想找到有特殊字符串的句子，但不想在特定的句子中出现。这就像grep 'word‘file \ grep -iv的“特定句子” 输入：你好，这里是世界福在这里的狐狸带吧台的foo 现在和foo一起去酒吧结果应该是找到' foo‘这个词，而不是当这个句子是'bar with foo now’时:输出：你好，这里是世界福在这里的狐狸带吧台的foo 这能用一行正则表达式吗？

浏览 2提问于2012-03-08得票数 0

1回答

Lucene :没有停止的搜索不会返回结果。

我使用的是Lucene.net 3.0.3，我不明白停止词在查询中是如何工作的。我把这段文字作为输入：Stop the word 我使用StandardAnalyzer(Version.LUCENE_30)进行索引和查询。索引只有一个字段Title 该字段被设置为存储和分析。我也玩过不同的TermVector。对于查询解析，我使用简单的QueryParser.Parse和这就是问题所在：查询Title:stop the word返回文档-这很好对Title:stop word的查询不返回文档-我期待它，因为停止词被从索引中删除。然后我切换到LUCENE_24，第二个查

浏览 1提问于2014-03-03得票数 1

回答已采纳

2回答

如何查找字符串中是否存在紧跟非字母字符的单词

、

我相信这个问题最有效的解决方案是使用Regex，但是我不确定语法。当查看一个句子时，你如何识别一个单词后面是否有一个非字母字符(除了a，b，c，d，e.)出现在一个字符串中。例子如下： String word = "eat" String sentence = "I like to eat!" This satisfies the condition because the exclamation point is not a letter String sentence = "I like to beat!" This does not s

浏览 3提问于2020-07-27得票数 1

回答已采纳

1回答

如何进行Solr查询，以返回围绕所查询的特定单词的单词范围？

、、

假设我有以下solr/lucene查询： bodytextsize_i*&q=word_i_want_to_search&partner=mypartnerid&rows=10 &fq=batchid：我想知道我能补充什么，以便在答复中将查询词周围的句子或特定范围的单词返回给我。例如，假设一份文件有以下一句：计算机的word_i_want_to_search坏了。我希望能够查询word_i_want_to_search，并让响应显示整个句子。这个是可能的吗？谢谢!

浏览 0提问于2018-11-16得票数 2

2回答

特定的单词必须介于两个子字符串之间，regex python。

、

我有一个regex来查找以今天开头，以结尾的句子。或·，但在第一个单词(今天)和最后一个单词(.\·)之间--，，必须在句子中。 description = 'Today is a beautiful day in one of the last days of April. Other sentence ...' pattern = re.finditer("(Today).*?[\.•]", description, re.IGNORECASE) for i in pattern: print(i.group(0)) # desired output

浏览 8提问于2021-04-26得票数 0

回答已采纳

1回答

PHP Regex在一定数量的字符之后匹配句号

、、、、

我不知道怎么用regex做这个。我想匹配一个句号后，一定数量的字符在句子中。 this is a long sentence. it contains a few full stops in it. I want to match the full stop after the halfway point. this sentence is shorter. it also contains full stops but not many. 它也不应该匹配最后一个句号。它应该匹配第一句中的第二个句号，而在第二个句子中没有匹配。所以比赛应该是这样的： this is a long senten

浏览 2提问于2017-09-28得票数 1

回答已采纳

1回答

空间依赖解析:负面规则

、

我正在使用依赖解析器来查看一个句子是否与规则匹配(除了异常)。例如，我试图找出名词主语没有补语的所有句子(形容词、复合词等)。一个积极的例子是。 The school is built in 1978. 一个否定的例子是。 The Blue Sky Airline is 70 years old. 我目前的Spacy模式符合这两种情况。 [ {"RIGHT_ID": "copula", "RIGHT_ATTRS": {"LEMMA": "be"}}, # subject of the verb

浏览 1提问于2022-01-26得票数 1

1回答

文本语义预处理

、、、、

假设我有一个车祸数据集。每个事故都有使用一组摄像头和其他传感器进行的文字描述。假设现在我只有一个摄像头的数据(例如正面)，并且我想删除描述中与其无关的所有句子。我认为一个基本而简单的解决方案可能是使用布尔检索系统，使用一组特定的关键字来删除不需要的句子，但我也不知道这是否是一个好主意，如果它可以工作；有人能给我一些建议吗？什么样的统计数据对研究这个问题可能是有用的？谢谢

浏览 20提问于2020-02-18得票数 0

4回答

字符串替换的Regex模式

、

我有句“名字2”，我要把“#”改为“不”，最后一句必须是“第二名”。密码- string sentence = Regex.Replace("Name # 2", "\\#\\b", "No."); 显然，Regex.Replace没有将“#”替换为“No”，是否有正确的方法通过正则表达式来解决这个问题。谢谢，我之所以要寻找regex模式，是因为有一个通用代码执行，如下所示 string pattern = string.Format(@"\b{0}\b", context); sentence = S

浏览 0提问于2016-11-21得票数 5

回答已采纳

1回答

在R中替换句子中的名词式

、

假设我有我的句子txt2 <- "useRs may fly into JFK or laGuardia" 我可以将给定句子的首字母和最后字母大写，第一个词的大写如下： sub("(\\w)(\\w*)(\\w)", "\\U\\1\\E\\2\\U\\3", txt2, perl=TRUE) 最后一个词是： sub("(\\w)(\\w*)(\\w)+$", "\\U\\1\\E\\2\\U\\3", txt2, perl=TRUE) 使用R中类似的概念将第三个单词大写为FlY的诀窍是什么？

浏览 1提问于2019-08-06得票数 3

回答已采纳

1回答

在比赛结束后提取5个单词的正则表达式

、

我正试图在我的应用程序中创建一个正则表达式，并且很难理解它。我已经创建了一个正则表达式，但我仍然希望修改它，使其不匹配特定的内容。我需要为iOS和Android创建regex。这是我的领地 (?:rahul[\s"'?.!:s()\{\}]) 这是我的测试字符串 rahul hello rahul! vyas and rahul? and rahul. and rahul: and rahul and rahul( and rahul) and rahul{ rahul.shiv rahuls vyas rips rahul!! 这是我用来创建regex 的站点我真正想要

浏览 3提问于2021-03-08得票数 3

回答已采纳

2回答

为什么看上去不匹配？

、

我需要(在PHP中)用不能成为句子中第一个或最后一个的单词来分割一个句子。说这个词是“压力”，这是我的准则 /^.+?(?=[\s\.\,\:\;])pression(?=[\s\.\,\:\;]).+$/i 住在这里：首先，它不匹配。接下来，我想-这样的分裂是完全有可能的吗？我试过简化的例子 print_r(preg_split('/^.+pizza.+$/', 'my pizza is cool')); 住在这里当我期望['my ', ' is cool']时，它会打印一个由2个空字符串组成的数组。

浏览 4提问于2021-06-19得票数 2

回答已采纳