使用RegExp根据句号、问号和感叹号对段落中的句子进行计数 - 腾讯云开发者社区

、

给出一段话，我想把它分成几个句子。现在我只是在做这件事： var sentences = paragraph.split('.'); 它在很大程度上起作用，但是当给出这样一个句子时，它就会失败：阿拉斯加是美国最大的州。因为U.S.有句点，所以它将S解析为一个句子。确定段落中句子的最佳方法是什么？我考虑过根据国会信之前的最后一个句号来解析它们，但是如果段落没有很好地输入(句号后的小写字母)，它也会失败。

浏览 0提问于2013-05-26得票数 1

2回答

贝壳:句数的意思是什么？

、

我需要数几个句子和段落，但我不明白如何从文本文件中做到这一点。我可以使用wc命令计算行数和单词数，但是我不理解文本文件中句子和段落的含义。shell中是否有执行此操作的命令？下面是我们如何计算文本文件中的单词和行数： wc -w filename wc -l filename 对于句子和段落，以下是我尝试过的： grep -c \\. #to count number of sentences. grep -o [.'\n'] #to count number of paragraph. 我不明白如何计算文本文件中的句子和段落数。任何想法都会有帮助。例如：主要文

浏览 2提问于2014-01-11得票数 1

回答已采纳

1回答

基于RNN- LSTM语言建模的用户输入语序预测

、、、、

我是深度学习和python的新手。我的任务是从用户给出的单词中预测句子的顺序。我看过很多关于单词预测的文章，但很少有关于句子预测的文章，这些文章让我了解了如何在句子中随机预测，但我必须从特定的输入为我的项目生成语义正确的句子。请帮助我，因为概念对我来说很清楚，但我发现很难code.The指向tensorflow教程解释语言模型的链接。它被设计为在给定先前上下文信息的情况下预测下一个单词。经过训练的模型将流畅地打印出有意义的句子。我想要建立一个语言模型来“从单词中预测句子的顺序”。例如，如果用户输入“苹果吃人”，我的语言模型应该能够产生语义上正确的句子i-e“人吃苹果”。

浏览 2提问于2017-08-22得票数 0

1回答

是否可以将语音合成器编程为更准确地阅读文本

、、

我有一个程序，它通过读取文本框中的每个句子来使用SpeechSynthesizer。有没有一种方法可以让合成器识别句点和问号之间的差异，以便更准确地阅读文本？

浏览 0提问于2014-11-12得票数 0

2回答

javascript regexp查找特定句子

、

这可能是一个简单的问题，但我对正则表达式还是相当陌生的。给定一个段落，我想找到以指定单词开头的特定句子，并将整个句子替换为其他单词。如何构建正则表达式来搜索以特定单词开头的句子，该句子后面可以有许多不同的单词，并以句点( . )结束。例如，给定句子foo bar. foo3 bar3. foo2 bar2.，查找以foo3开头、具有任意数量的单词、以.结尾的子字符串。

浏览 1提问于2012-04-09得票数 1

回答已采纳

1回答

在C#中识别段落中的句子

、、

我在一个POC上工作，它的目的是在字符串输入段落中找到句子。在我开始之前，我想知道我是否可以使用任何现有的C#库或nuget库来实现此目的？

浏览 0提问于2015-12-14得票数 0

3回答

从python中的段落中提取句子的正则表达式

、、

我试图使用python中的正则表达式从段落中提取一个句子。通常，我测试的代码正确地提取了句子，但是在下面的段落中，句子没有被正确地提取。该段： “但在疟疾感染和脓毒症的情况下，整个身体的树突状细胞都集中在提醒免疫系统，这阻止了他们发现和应对任何新的感染。一种新型疫苗？守则： def splitParagraphIntoSentences(paragraph): import re sentenceEnders = re.compile('[.!?][\s]{1,2}(?=[A-Z])') sentenceList = sentenceEnders.split(par

浏览 1提问于2011-12-11得票数 3

回答已采纳

2回答

如何用regex提取关键字前后的句子数

、

我的段落:你好。这是开始的一段。还有一句话。这个句子包含一个可以匹配的关键字。我要接受这句话。还有这句话。这个不包括在内。 My search关键字：关键字期待的结果:这是一个开始。还有一句话。这个句子包含一个可以匹配的关键字。我要接受这句话。这句话也是我想在段落中的关键字前后得到一些句子(也包括包含关键字的句子)。在上面的例子中，句子的数量是2，如果没有足够的句子，那么返回它可以得到的最大值(1或0)。我试着用这个模式"\.([^.]+\.[^.]*" + "keyword" + "[^.]*\.[^.]+)"来得到带点的句子，但是我不

浏览 2提问于2020-06-05得票数 1

回答已采纳

1回答

史坦莎节图书馆很慢吗？

我有两套代码来计算一个文本文件中的句子数。这两个选项产生不同的结果，选项2(第二节)非常缓慢。备选案文2(节)是否更准确？我该如何加速备选方案2(第二节)？非常感谢! 选项1(正则表达式)：以下代码需要2秒，输出为1444。 import requests from bs4 import BeautifulSoup import re sentence_regex = re.compile(r"\b[A-Z](?:[^\.!?]|\.\d)*[\.!?]") def identify_sentences(input_text:str): """R

浏览 3提问于2022-02-24得票数 0

2回答

hive语句函数如何中断每个句子

、

在发帖之前，我尝试了蜂巢句子功能，并做了一些搜索，但没有得到明确的理解，我的问题是基于什么分隔符蜂巢句子功能打破了每句话？蜂窝手册上说“适当的边界”是什么意思？下面是我尝试的示例，我尝试添加句点(.)和感叹号(！)在句子的不同位置。我得到了不同的输出，有人能解释一下吗？带句点(.) select sentences('Tokenizes a string of natural language text into words and sentences. where each sentence is broken at the appropriate sentence boundar

浏览 0提问于2017-01-04得票数 2

1回答

preg_match语句中的正则表达式

、

需要帮助修复第13行preg_match语句中的正则表达式。这是用于表单上的注释字段，我希望注释能够尽可能长，但它们应该只能使用字母、数字、感叹号、问号、逗号和句号，没有其他的。换句话说，一个或两个基本句子。这是我的密码。 // Validate the message field is in regex format. add_action( 'elementor_pro/forms/validation', function ( $record, $ajax_handler ) { $fields = $record->get_field( [

浏览 1提问于2022-05-20得票数 0

回答已采纳

1回答

在Python中识别aiml模式中的点

、

在我的一个项目中，我试图识别给定句子中的文件名。例如，“可不可以请打开abc.txt"，因此我需要获取关键字" open”，以便知道预期的操作类型，并且出于显而易见的原因，我还需要识别文件名。为此，一个简单的AIML标记是： <aiml> <category> <pattern>* OPEN *</pattern> <template>open <star index="2"/></template> <category> </aiml>

浏览 4提问于2017-10-21得票数 1

4回答

使用扫描仪在文件中存储单词的出现次数及其计数。( Java )

、

代码如下： Scanner scan = new Scanner(new FileReader ("C:\\mytext.txt")); HashMap<String, Integer> listOfWords = new HashMap<String, Integer>(); while(scan.hasNextLine()) { Scanner innerScan = new Scanner(scan.nextLine()); boole

浏览 0提问于2012-03-15得票数 1

回答已采纳

3回答

PHP preg_match组重复

、、

我有一个(php5.2和5.3)正则表达式，它需要从用户帖子(可能包括电子邮件地址和超链接)中提取第一个$x语句，并且在试图找出原因时遇到了麻烦(是的，它是一个丑陋的正则表达式；当它工作时，我会对其进行优化)： /^(([^.!?]+|(\w+[.@?&=%:])+\w+)+[.!?]+\s){0,4}/ 返回前四个句子，但是 /^(([^.!?]+|(\w+[.@?&=%:])+\w+)+[.!?]+\s){0,5}/ 不返回匹配项。我的理解是，{0,5}应该与前一个组匹配0到5次，因此如果它只能匹配4次，应该仍然有效。有没有人能解释一下这种行为？更新：$x只是一个任意数

浏览 1提问于2011-03-29得票数 1

回答已采纳

4回答

使用jQuery突出显示长句子

、、、、

我想突出显示页面上一组段落对象中包含的长句子(例如，50个单词或更多)，即$("#content p")。我不确定该如何解决这个问题。我最初试图突出显示所有句子，但当它们包含HTML标记时遇到了麻烦(网络上的示例突出显示代码似乎只针对单个单词，所以它们没有考虑到子节点)。我知道拆分句子很难；我想用。！？后面要么是一个空格，然后是一个大写字母，要么什么都不接(即段落末尾)。提前感谢您的帮助/建议。

浏览 2提问于2010-02-26得票数 6

2回答

如何将1段长的段落分成2段？Google文档

、、

我希望段落最多可达3句。为此，我的策略是循环所有段落，并找到第三句结尾(见注)。然后，在它后面添加一个"\r“字符。，这是我的代码： for (var i = 1; i < paragraphs.length; i++) { ... sentEnds = paragraphs[i].getText().match(/[a-zA-Z0-9_\u0590-\u05fe][.?!](\s|$)|[.?!][.?!](\s|$)/g); //this array is used to count sentences in Hebrew/English/digits tha

浏览 3提问于2020-03-04得票数 0

回答已采纳

2回答

R正则表达式替换除句子标记、撇号和连字符以外的所有标点符号。

、

我正在寻找一种方法来标记R中句子的开始和结束。为此，我想消除除句号、感叹号、问话符号和连字符等句号结束之外的所有标点符号，我想用标记*来代替。同时，我也想保留包含撇号的单词。为了给出一个具体的例子，给出这个字符串： txt <- "We have examined all the possibilities, however we have not reached a solid conclusion - however we keep and open mind! Have you considered any other approach? Haven't you?&

浏览 14提问于2015-08-06得票数 0

4回答

计算字符串中的句子数，同时计算javascript中的小数。

、

假设我有一个段落： var word = "Hi, I am new to this world! I am a robot, my name is RX1.456 and my age is 1.0453 days. Thats all for now, you have any qeustions?" 我想找出这个句子的数量(在本例中是3句)，对此我会： word = word.toLowerCase(); word.split(/[.!?]+/).filter(Boolean).length; 问题是，我不知道如何处理点运算符时，它是不标记一个句子的结尾，如小数。我该怎

浏览 0提问于2016-02-09得票数 1

回答已采纳

2回答

创建单词以查找带有括号首字母缩写的句子(VBasic RegEx )

、、、

我正在编写一个脚本，用于擦除文档以查找格式为(USA)的缩写词。作为一个处理工具，我需要抓取出现括号首字母缩写的整个句子。现在，我查找缩写词的代码是： With oRange.Find .Text = "$[A-Z]{2,}$" .Forward = True .Wrap = wdFindStop .Format = False .MatchCase = True .MatchWildcards = True 结合使用Do While .Execute，我可以梳理文档并找到缩写词

浏览 2提问于2017-05-05得票数 2

4回答

包含一组单词的文本部分的正则表达式

我有一个很大的文本，里面有几个段落。我想搜索包含一组单词的文本，而不是以任何顺序，例如{"word3"，"word2"，"word1"}。需要返回文本的部分，它可以跨越多个句子或段落。请问这个的正则表达式是什么？

浏览 0提问于2018-04-25得票数 0

4回答

在每个句子的第一个字母大写的段落中？

、、、、

我从php.net获得这个函数，把大写字母转换成句子大写大写。 function sentence_case($string) { $sentences = preg_split('/([.?!]+)/', $string, -1, PREG_SPLIT_NO_EMPTY|PREG_SPLIT_DELIM_CAPTURE); $new_string = ''; foreach ($sentences as $key => $sentence) { $new_string .= ($key & 1) == 0

浏览 8提问于2017-09-25得票数 1

回答已采纳

1回答

Regex:如何拆分句子，然后在Javascript中使用分隔符重新连接它们？

、、

我想使用这些分隔符从段落中拆分句子：(请注意，每个标点符号后面都有空格来表示不拆分，例如浮点数，例如2.567 var d = ['. ', '; ', ': ', '? ', '! ']; 一旦我完成了这些句子的修改，我想连接(粘合)这些句子，并恢复它的标点符号。我如何做到这一点呢？

浏览 0提问于2020-04-20得票数 0

2回答

如何删除"!“除了最后一句之外？

、、

我想要写一个程序，除去所有感叹号，除了那些在句子的末尾。我已经这样做了，删除了每个感叹号在一个给定的句子。 string = input("Enter a string with exclamation marks: ") char = set('!') if any((c in char) for c in string): print (string.replace('!', '')) 所以基本上现在，我是如何针对最后一个句子中的最后一个字母的？

浏览 2提问于2020-12-01得票数 1

回答已采纳

1回答

在R中将段落拆分成句子

、、

我正在使用strsplit函数来做这件事。我发现了许多用于此目的的正则表达式： (?<!\w\.\w.)(?<![A-Z][a-z]\.)(?<=\.|\?)\s 首先，当我在R中简单地使用它时，我得到了错误： sl <- unlist(strsplit(txt1,"(?<!\w\.\w.)(?<![A-Z][a-z]\.)(?<=\.|\?)\s")) 错误：'\w‘是以""(？)开头的字符串中无法识别的转义另外，当我尝试在中测试它时它不能解决我的问题我的段落是： As of Feb. 9, the Mi

浏览 0提问于2016-02-10得票数 2

1回答

对抽取的句子进行收敛，并统计每个段落的预测标签

、

我和克尼姆有点问题。我在一个excel文件中有一些段落，我想找出在每个段落中有多少句子是肯定的，声明的。因此，我有一个带有标记句子的数据集。我已经在该数据集上构建了一个模型。现在，我使用该数据集通过SentenceExtractor节点对段落的句子进行预测，并应用该模型进行预测。现在，问题是预测是基于句子的，我需要知道每段中有多少句子是肯定的，等等。如何将提取出来的段落句子连接起来，统计每个段落句子的预测值，并记录到excel文件中？任何帮助都将不胜感激。我已经尝试过rowID和groupBy节点。但是我不能去

浏览 0提问于2019-08-29得票数 0

1回答

Shell脚本在文件中的每一行末尾添加一个句号(不包含句号)

、、、、

我有一份文件，每一行都有一个句子。 Random stuff, "First sentence", "second sentence.", "Third sentence!" More Random Stuff, 等等..。我只想在上面的例子中修改引号行，即第2行、第3行和第4行。我想做以下修改- 在行尾添加一个句号(如果没有句号或感叹号)，使第一个字符大写(如果没有大写) 我尝试了下面的解决方案来增加一个句号- sed -i 's/[^!.]",/.",/g' $file 上面的命令删除了句子的最后一个字符-

浏览 3提问于2019-10-20得票数 3

回答已采纳

1回答

解释段落中句号/句号的用法。

、

我在我的业务中使用COBOL，我最初是在一个使用perform - thru ...的站点上学习的。现在我换了工作，当地的编程标准也不同了，所以我需要习惯于不通过调用来执行任务。我对段落中句号/句号/点的使用也有疑问。你可以用句号来结束段落中的句子。我之所以这样说，是因为我在一些地方看到该段以第一点结尾，而在其他地方，我看到句号/句号/点的用法与此不同。我写了两种结构，我认为下面应该是平等的。是真地吗？结构A： PERFORM 100-WRITING. PERFORM 200-FINISH. 100-WRITING. *-----------

浏览 6提问于2015-01-05得票数 2

回答已采纳

2回答

Java Shingle对

、、

我在编写一个程序时遇到了麻烦，这个程序是从文本文件中的每个句子中创建板条对的。现在，我的代码用Java读取一个.txt文件，并按顺序输出每个句子。我想要分别存储每个句子，然后取每一个句子，并创建他们的两个字符板，这将存储在一个数组中。这方面的一个例子是把“快棕狐”这句话变成{th，he，e，q，qu，ui，ic，ck，k，b，br，ro，ow，wn，n，f，fo，ox}，这样单词之间的所有空格都会被计算在内。我的目标是简单地接受每句话，并为每个句子创建一个数组，该数组包含上面示例中的板对。我的问题是我不知道该怎么做。我似乎不知道如何把句子分开存储，我也不知道如何创建板子对。我对Java还是很陌

浏览 2提问于2015-02-18得票数 1

回答已采纳

3回答

将段落转换为具有动态记忆的句子

、、、、

我怎样才能把一个段落转换成句子？我有一个函数签名如下： char **makeSentences(char *paragraph); 其中： paragraph是一个包含几个句子的字符串。段落确保每句以句号(.)结尾。整个段落以一个null-terminator.returns结尾，这是一个动态分配的句子数组. 我有点困惑如何分配内存的数组的句子在飞行。

浏览 3提问于2011-11-20得票数 0

3回答

支持向量机中不同大小特征向量的编码

、、、

我致力于对一些评论(段落)进行分类，由多个句子组成。我通过libSVM在Weka中对它们进行分类。然而，我有另一个想法，我不知道如何实现：我认为在评论中创建每个句子基于句法和浅语义的特性是值得一试的。但是，由于段落的句子大小不同，我无法找到对这些特性进行顺序编码的任何方法。我之所以想把这些特征按顺序排列，是因为句子特征的顺序可能为分类提供了更好的线索。例如，如果我有两个实例P1 (有3个句子)和P2 (2个句子)，我就有一个类似的空格(假设每个句子都有一个二进制特性作为a或b)： P1 -> a b b /classX P2 -> b a /classY 那么，我的问题是，我是否

浏览 2提问于2014-05-31得票数 2

回答已采纳

1回答

用扫描()在R中提取句子

、、、

我被告知，我不应该使用R扫描文本(但我一直这样做，无论如何，在获得其他技能)，并遇到了一个问题，使我足够困惑退步到这些论坛。谢谢你的帮助，提前。我试图将大量的文本(例如，一个短篇小说)存储为字符串的向量，每个字符串都是一个单独的句子。我一直在使用scan()函数来完成这个任务，但是我遇到了两个基本问题：(1) scan()似乎只允许一个单独的字符，而句子显然可以以多种方式结束。我知道如何用regex标记句子的结尾(例如！？)，但我不知道R中有一个函数使用正则表达式来分割文本。(2) scan()似乎自动将新行视为一个新字段，而我希望它忽略新行，除非它们与句子末尾重合。 download.fi

浏览 1提问于2015-02-17得票数 0

回答已采纳

1回答

准确的句子和单个单词匹配吗？

、

我有一个输入字段，用户可以在其中搜索一个单词或一个句子。比方说，在一段文字中：段落是文件的基石。许多学生根据段落的长度来定义段落:一段至少有五句话，一段长达半页，等等。然而，在现实中，句子之间思想的统一和连贯才是构成段落的要素。段落的定义是“一组句子或一句构成一个单位的句子”(Lunsford和Connors 116)。长度和外观并不决定论文中的某一节是否为段落。例如，在某些文体中，特别是新闻文体中，一段可以只有一句长。最后，一个段落是支持一个主要观点的一句或一组句子。在这份讲义中，我们将这称为“控制思想”，因为它控制着段落其余部分发生的事情。作为用户，我输入students d

浏览 0提问于2019-02-15得票数 1

回答已采纳

3回答

Python正则表达式-只接受只包含字母的句子

、

这是我任务的一部分中的一个模块，但是，我试图调整正则表达式字符串，以接受语句，而不是只接受只有字母的单个单词。我对python编程相当陌生，已经为我的GCSE学习了大约一年，希望能得到一些帮助。 validateLoop = True while validateLoop: #While loop used to loop back around if choice is invalid shift = input("Enter a sentence: ").lower() #Takes input for a sentence if not (re.match

浏览 1提问于2014-10-15得票数 1

1回答

如何在python中使用regex提取这个句子？

、、

我正在尝试从研究文章中提取有引用的句子。除了那个句子之外，我已经把所有的句子都提取出来了。关联(对于正在经历学习过程的个体)在Hidi和Renninger的模型(2006)中似乎是触发因素，可以是Priniski等人的连续体中的任何一种关联类型。 (r'\w.+$\d{4}$+\.*', regex = True)是我使用过的模式。我不知道括号内的词语是否要处理。该条中的样本段落：成人教育的工作相关性:个案研究叙述2，Hanne Haave2和Aristidis Kaloudis1 \n nOn，挪威\nTone.vold@ntnu.no \nTone.vold@in

浏览 3提问于2020-07-16得票数 1

5回答

正则表达式需要识别句子之间没有空格的位置

、

我需要一个正则表达式来标识句子开头前一个句点后面没有空格的所有实例。例如，这是一个不好的句子： I'm sentence one.This is sentence two. 这个问题需要修复如下： I'm sentence one. This is sentence two. 这不是一个简单的字符串替换的例子。with‘。‘因为也有很多空格，段落中其他句子的间距是正确的，这会给它们一个额外的空格。

浏览 7提问于2010-12-10得票数 1

回答已采纳

2回答

目标信息提取/重点提取摘要

、、、

我有大量的项目手册，每一个都有大量的页面。每本手册都载有某种形式的摘要段落，尽管这些段落的结构或格式不一定各不相同。手册的其余部分通常包含大量与项目有关的各种信息，并不总是与需要提取和总结的内容相关。从理论上讲- paragraph 1 - Project Summary (Extract this) paragraph 2 - Background info (ignore) paragraph 3 - Background info (ignore) paragraph 4 - Background info (ignore) paragraph 5 - Project Requirem

浏览 0提问于2019-06-21得票数 0

回答已采纳

4回答

如何在c中动态分配结构数组？

、、、、

我想实现一个简单的单词统计程序，它将打开一个文本文件，它是作为命令行参数提供的，然后计算该文本文件中的单词数，非字母单词(例如: 1998，2-3等)的句子和段落的数量。假设两个空格之间的字符数组算作一个单词，并且非字母单词由数字、连字符等组成，则每个句子以‘’结束(点)字符，而段落则用换行符分隔。我将使用一个结构来保存每个段落的字数、非字母字数、句子数和起始行，如下所示： struct { int word; int sentence; int nonAlpha; int startingLine; struct Parag

浏览 0提问于2012-12-13得票数 1

3回答

以超链接结尾的句子

、、

每当我遇到这个问题时，总是会有几秒钟的困扰，所以为了在我的网络开发生涯中节省几分钟的思考时间：如果有一个以超级链接结尾的句子，如下所示：如果你想联系，我应该在锚内或锚外以句号结尾吗？

浏览 2提问于2012-01-09得票数 1

回答已采纳

2回答

在Emacs中将一个空格替换为两个后面的句子

、、

我有一个带有段落的文档，其中一些句子以一个点和一个空格(". Nextline")结尾，而另一些以一个点和两个空格(". Nextline")结尾。我想取代点和一个空格点和两个空格，但不增加现有的点和两个空格点和三个空格。除最后一句外，段落中的句子不以换行符或"\n“结尾。段落末尾将有一个换行符。我想以两个空格开始每句话，既不是1，也不是3或更多。如果我从菜单中使用搜索和替换，从2个空格开始的句子在开始时会增加到3个空格。我怎么能这么做？我试过这样做，但它将两个空格增加到三个： (defun space12 () (interactive)

浏览 4提问于2017-04-14得票数 1

回答已采纳

3回答

NodeJS:根据短语从html文本中提取句子

、

我在数据库中存储了一些文本，如下所示： let text = "<p>Some people live so much in the future they they lose touch with reality.</p><p>They don't just <strong>lose touch</strong> with reality, they get obsessed with the future.</p>" 文本可以有许多段落和HTML标记。现在，我也有一个短语： let phras

浏览 6提问于2020-06-04得票数 5

回答已采纳

2回答

用感叹号代替问号，反之亦然

、、、

我需要编写一个函数来接收一个句子字符串和一个真/假的‘叫喊’参数。它应该返回字符串，将任何问号替换为感叹号，反之亦然。如果‘喊’是真的，所有的字母都应该大写。 function changeIntonation(str, isShouting) { let myString = ''; let regExcl = /\!/; let regQmark = /\?/; let qMarkStr = str.replace(regQmark, '!'); let finalStr = qMarkStr.replace(regExcl, '?');

浏览 1提问于2017-12-27得票数 0

回答已采纳

2回答

滥用nltk的word_tokenize(发送)的后果

、

我正试图把一段话分成几个字。我手头上有一个可爱的nltk.tokenize.word_tokenize(发送)，但是help(word_tokenize)说，“这个标记器被设计成一次处理一个句子。” 有没有人知道，如果你把它用在一个段落上，比如最多5个句子，那会发生什么？我自己也试过几段短短的段落，这似乎很有效，但这还不是决定性的证据。

浏览 0提问于2013-10-15得票数 6

回答已采纳

1回答

在句子中用特殊的形式.{‘{’分隔文本

、

我正在分析维基百科中的一些信息，转储中的文本包括链接的特殊注释和{{content}}或[[content]]形状的图像。我想把文本分成几个句子，但是当点后面不是空格，而是前面的符号之一时，问题就出现了。因此，一般来说，当'. ', '.{{', '.[['发生时，它必须分裂。示例： prueba = 'Anarchism does not offer a fixed body of doctrine from a single particular worldview.{{sfn|Marshall|1993|pp=14–17}} M

浏览 0提问于2019-05-09得票数 0

回答已采纳

14回答

如何将一段文字解析成句子？(最好用Ruby)

、、、、

如何处理段落或大量文本，并将其拆分成句子(最好使用Ruby)，同时考虑到像先生、博士和美国这样的案例？(假设您只是将句子放入一个数组中) 更新:我想到的一个可能的解决方案是使用词性标记器(POST)和分类器来确定句子的结尾：从琼斯那里得到的数据显示，当他走上意大利夏季住宅的阳台时，他感觉到了温暖的阳光照射在脸上。他很高兴能活着。分类器/人琼斯先生/人感觉/O温暖/O太阳/在/O他/O脸/O作为/O他/O走出来/O走到/O阳台/O/O他/O夏天/O家/O在/O意大利/地点/O他/O很高兴/O去/O是/O活着/O 将/NNP Jones/NNP felt/VBD先生/DT warm/JJ su

浏览 0提问于2009-05-13得票数 22

回答已采纳

2回答

用于MS Word的VBA，而不是遍历段落中的所有句子

、、

我试着把单词文档中的所有句子循环起来，并将它们解析成半HTML代码。在测试过程中，我遇到了一种有趣的情况，在这种情况下，任何一个句子后面跟着一个非结束句都会被跳过。例如，如果我有以下两句话：这是一个有特殊字符的段落中的第一句，还应该有一个句子。这是应该出现的第二句。** 当我循环遍历paragraph.range.sentences中的每个句子时，我只得到第一句和段落末尾的".**“。但是，如果我在句点和中心之间添加了一个空格，那么代码就可以工作". **“。如何确保宏读取一个句子中的所有文本，即使句点之后没有空格？下面是我的示例代码： Public Sub Par

浏览 1提问于2013-05-21得票数 1

回答已采纳

3回答

如何知道一个段落使用Jquery或Javascript包含多少单词？什么功能？

、、、

如何知道一个段落使用Jquery或Javascript包含多少单词？什么功能？例如，这个句子如何知道一个段落使用Jquery或Javascript包含多少单词？包含13个单词。如何使用Jquery或javascript进行计数？

浏览 6提问于2009-11-21得票数 1

回答已采纳

2回答

净化句子的要求，快完成了

、、

我现在的php语句杀菌剂功能： function sanitize_sentence($string) { $pats = array( '/([.!?]\s{2}),/', # Abc. ,Def '/\.+(,)/', # ......, '/(!)!+/', # abc!!!!!!!! '/\s+(,)/', # abc , def '/([a-zA-Z])\1\1/');

浏览 4提问于2012-11-16得票数 1

回答已采纳

2回答

自动摘要-全文或段落

、

我正在编写一个工具，让用户能够总结网页上的文本内容，通过突出他们希望得到摘要的文本。到目前为止，我已经收到了一些结果，我可以使用这些结果来进一步优化算法，但只适用于单个段落。当选择多个段落时，摘要并不十分成功，因为它通常侧重于所选文本输入的某个主要部分，而忽略了摘要中也应该提到的其他部分。这是因为整个算法的功能是确定一个段落中最重要的句子(或者在这种情况下，多个段落合并在一个大的“段落”中)，然后确定其他哪些句子与这个“核心句”相关/重要。该算法采用抽取自动文摘(关于维基百科的解释)。由于单个段落通常处理一个主要主题，这种算法在这种情况下运行良好，但是当一个包含多个段落(因此通常是多个主要

浏览 0提问于2017-04-02得票数 1

4回答

简单Java正则表达式不起作用

、、、、

我有这个正则表达式，它应该删除句子分隔符(.和?)： sentence = sentence.replaceAll("\\.|\\?$",""); 它工作得很好，它转换成 "I am Java developer."到"I am Java developer" "Am I a Java developer?"到"Am I a Java developer" 但在部署之后，我们发现它还将句子中的任何其他点替换为 "Hi.Am I a Java developer?"成为"HiA

浏览 1提问于2010-10-28得票数 7

回答已采纳

3回答

如何选择最接近最接近时期的前280个单词？

、

我需要从一个较长的单词中提取一个较短的文本片段。我可以用 text = "There was a very big cat that was sitting on the ledge. It was overlooking the garden. The dog next door watched with curiosity." text.split[0..15].join(' ') >>""There was a very big cat that was sitting on the ledge. It wa

浏览 1提问于2018-09-19得票数 2

回答已采纳