使用正则表达式检测可能带有撇号的单词，这些单词是用ASCII编码的吗？ - 腾讯云开发者社区

regex

我正在寻找一个模式，可以找到单引号内的撇号。例如，文本傻瓜不能‘酒吧’不要‘ 我想找到并替换“不能”和“不”中的撇号，但我不想找到单引号我试过这样的方法 (.*)'(.*)'(.*)' 并将该替换应用于第二个匹配组。但是对于带有撇号的两个单词的文本来说，这种模式是行不通的。编辑:为了澄清文本可以有单引号，其中没有撇号，这应该保持原样。例如 ‘'foo’不能‘bar’不要‘ 我仍然在寻找撇号，所以foo周围的单引号不应该匹配。

浏览 6提问于2016-04-01得票数 0

3回答

从文本文件中只提取带有撇号的单词

java、regex

我需要从文本文件中提取带有撇号的单词。我有一个程序，提取单词的长度是一定的量(在下面的程序3)，并有撇号。然而，我需要那个人只考虑那些带有撇号的词，而不考虑任何其他条件。 public static void main(String[] args) throws IOException { ArrayList<String> words = new ArrayList<String>(); String s = "I want to have a lot of money's when I am older.";

浏览 2提问于2014-10-19得票数 0

回答已采纳

3回答

字符集-utf8 8和字符实体

html、encoding、utf-8、editor、html-entities

我提议将我的windows-1252 XHTML网页转换为UTF-8。我的编码中有以下字符实体： ' -撇号， ► -右指针， ◄ -左指针. 如果我更改字符集并使用我的编辑器将页面保存为UTF-8：撇号保留为字符实体；指针被转换为代码中的符号(大概是因为UTF-8?中不支持实体)。问题：如果我正确地理解了UTF-8，您就不需要使用实体，并且可以直接在代码中键入字符。在这种情况下，用键入的撇号替换#39是安全的吗？编辑器将指针符号直接放入我的代码中，并在现代浏览器上可靠地显示这些符号

浏览 2提问于2010-10-13得票数 2

回答已采纳

2回答

Regex命令，OR似乎不起作用

regex、sublimetext2

我用C#阅读了下面的部分课文 “我必须看你的驾驶执照和打印身份证标签，然后我才能送你过去，”他说，以一种扁平的，自动的方式，盯着角带着茫然的眼睛。我正在读这本书的几行，我想用所有的单词来创造字符串，包括那些带有撇号的字。我想根据非单词字符来分割行，但是我希望单词字符中包含撇号，所以我最终得到了一个字符串列表，其中只有单词，这样“驱动程序的”这个词就在一起了。我使用崇高来测试表达式，但是当我做(\W+|\')时，撇号仍然会被捕获。我不想把“你会”这样的东西分成两条线。\W+是完美的，但我只想包括撇号。我怎么能这么做？

浏览 0提问于2014-06-27得票数 0

回答已采纳

1回答

不使用撇号计算单词的Countif函数

google-sheets、excel-formula

我已经翻阅过论坛，但还没有找到解决方案。我在一张桌子上有这样的调查回复:没关系，我不喜欢学校--很好，我喜欢我使用一个countif函数来计算在调查中收到的每一个答复的次数。问题是，我的函数与这些价值观很好地配合:我不喜欢学校，我喜欢它，但我的函数没有抓住这个短语--没关系在使用命名范围时，我使用的公式是： =COUNTIF(问题，“没事”) 请查看示例文件的共享链接，并查看工作表2中的实际公式。最初，我认为这个问题是因为在单词“it‘s of”中的撇号，所以countif函数没有工作。正如你可以从我的例子中看到的，还有其他带有撇号的单词会被计算在内，所以我很困惑为什么这个函数不适用于短

浏览 1提问于2016-10-19得票数 0

回答已采纳

2回答

令牌构造不正确

java、text、tokenize

我正在尝试使用以下代码对文本文件进行标记： String fileContent = ""; String fileContentTokens[]; try{ fileContent = new Scanner(new File(fname)).useDelimiter("\\Z").next(); } catch(Exception ex) { System.out.println(ex.getMessage()); } fileContent =

浏览 1提问于2012-12-09得票数 0

回答已采纳

3回答

编码SEO友好URL

php、regex

我试图对一个短语进行编码，以便在URL中传递它。目前，它与基本单词很好地工作，其中空格被替换为破折号。 <a href="./'.str_replace(' ', '-', preg_replace("/[^A-Za-z0-9- ]/", '', $phrase)).'"> 它产生的结果如下： /this-is-my-phase 在这个URL接受我的页面上，我能够用空格替换破折号，并查询我的db以获得这个短语。我的问题是这个短语是否包含撇号。我的当前脚本删除了它。是否有任何方法来保存它

浏览 4提问于2015-11-12得票数 1

回答已采纳

2回答

去掉单引号并保留撇号的正则表达式

java、regex、grep、apostrophe

我想从文本文件中解析单词。应保留撇号，但应删除单引号。以下是一些测试数据： john's apostrophe is a 'challenge' 我正在尝试使用grep，如下所示： grep -o "[a-z'A-Z]*" file.txt 它会产生： john's apostrophe is a 'challenge' 需要去掉单词challenge周围的引号。正确/所需的输出应为： john's apostrophe is a challenge 编辑:由于一致认为撇号很难识别，我现在正在寻找一种方法来从所有

浏览 0提问于2012-03-22得票数 2

回答已采纳

1回答

撇号在HTML中转换为句点

html

我有一个客户使用CMS的网站。当它们输入撇号时，它们在HTML中呈现为句点。我检查了原始源代码，确实有一个撇号(‘-不是MS Word卷曲的“智能”撇号)，但它呈现为一个句号。我已经进入数据库并手动输入撇号，以为可能是CMS，但问题仍然存在。我以前见过无法辨认的“菱形问号”字符出现过，但从来没见过这个...例如，单词“they‘’re”显示为"they.re“ 有什么想法吗？我认为这可能是编码问题，但我已经准备好了<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"

浏览 0提问于2012-02-07得票数 0

8回答

如何在C#中使用正则表达式将短语拆分成单词

c#、regex

我正在尝试使用正则表达式将句子/短语拆分成单词。 var phrase = "This isn't a test."; var words = Regex.Split(phrase, @"\W+").ToList(); 单词包含"This“、"isn”、"t“、"a”、"test“ 显然，它正在拾取撇号并对其进行拆分。我可以更改此行为吗？它还需要多语言支持多种语言(西班牙语、法语、俄语、韩语等)。我需要把单词传给拼写检查器。具体地说，就是Nhunspell。 return (from word in words

浏览 0提问于2012-04-20得票数 7

回答已采纳

5回答

使用gsub在字符向量的R列表中用直撇号替换卷曲撇号

r、special-characters、text-mining、gsub

寻找关于如何在字符向量的R列表中用直撇号替换卷曲撇号的一些指导。我要替换卷曲撇号的原因--在脚本的后面，我检查每个列表项，看看它是否在字典中找到(使用qdapDictionary)，以确保它是一个真正的单词，而不是垃圾。词典使用直撇号，因此带有卷曲撇号的单词被“拒绝”。下面是我的代码示例。在我的测试列表中，第6项包含一个卷曲撇号，第2项有一个直撇号。示例： list_TestWords <- as.list(c("this", "isn't", "ideal", "but", "we",

浏览 8提问于2017-10-18得票数 5

回答已采纳

1回答

HTML中正确使用的撇号类型

html、character-encoding、apostrophe

如果我用键盘将一段文字直接写入HTML文档的文本编辑器中，并且其中一个单词有撇号，那么撇号的写法将完全如下所示： Here's an example of some text. 然而，如果抄袭字，同样的句子将出现如下： Hereʼs an example of some text. 在HTML文档中显示它们的正确方法是什么？正如我通常所做的那样，查找和替换使它们与'相同。此外，我还可以使用编码编写它们： ʼ = ʼ &pos; = ' ' = ' 有什么标准的方法吗？我知道&pos;是HTML5的东西，所以

浏览 1提问于2017-10-31得票数 2

1回答

对非字字符拆分作例外处理。

java、regex

我有以下命令： \s+|(?=[^\w'])|(?<=\W)(?=') 我在java中将其用作： String[] split = str.split("\\s+|(?=[^\\w'])|(?<=\\W)(?=')"); 这基本上允许我根据空格、特殊字符拆分单词，并为撇号留下一个例外，这样我就可以将内容保存在撇号中，而不分裂它。当撇号中有一个正常的字符时，这是非常有用的： Input: write('A') Output: write ( 'A' ) 但是，如果撇号中有一个特殊的字符，它就不能正常工

浏览 1提问于2016-09-19得票数 0

回答已采纳

3回答

无法在if语句中捕获撇号

c、if-statement、apostrophe

我正在创建一个程序，它接受一个文本文件和一个单词。它读取一个文本文件，并将该单词与正在读取的当前单词进行比较。我构建它的方法是忽略"'s“。例如，如果我在搜索"NASA”时遇到"NASA's"，它会读作"NASA“。不幸的是，我无法通过使用"if (ch == ''\')”来捕捉撇号，"ch“是当前的字符。我的理由可能是因为文本文件中的撇号看起来像这样。我不知道该如何适应这一点。下面是我捕捉撇号的方法： else if (ch == '\'')

浏览 1提问于2013-10-08得票数 2

4回答

修复YAML字符串的正则表达式

regex、yaml

我正在尝试创建一组YAML文件，主要由文本字符串组成。现在，当在单词中使用撇号时，它们必须通过键入双撇号进行转义，因为我使用撇号来包装字符串。我想创建一个正则表达式，它将检查文本中不是双精度的撇号。我所拥有的是： ^([^'\n]*?)'(([^'\n]*?)'(?!')([^'\n]+?))*?'$\n 我的问题是，只要我的字符串有一个双撇号，但也有一个不是双撇号的撇号，它就不匹配，因为我的负向先行不会在看到双撇号时立即匹配。(例如，字符串t''e'st将不匹配，即使它在e后面缺少双撇号) 我如何才能使我的负

浏览 3提问于2019-09-04得票数 1

3回答

是否删除R中字符串中的所有特殊字符？

regex、string、r、character

如何删除R中字符串中的所有特殊字符并将其替换为空格？要删除的一些特殊字符是：~!@#$%^&*(){}_+:"<>?,./;'[]-= 我尝试过带有[:punct:]模式的regex，但它只删除标点符号。问题2:如何从外语中删除字符，如：â í ü Â á ą ę ś ć？答:使用[^[:alnum:]]删除~!@#$%^&*(){}_+:"<>?,./;'[]-=，并使用[^a-zA-Z0-9]删除regex或regexpr函数中的â í ü Â á ą ę ś ć。 base R中的解决方案: x <- &

浏览 568提问于2012-04-24得票数 145

回答已采纳

1回答

在复制和粘贴时，撇号会发生变化

text、formatting、rendering

当我在程序之间剪切和粘贴撇号时(例如，notepad2、notepad++、hiedisql、word等)和所见即所得，以及我的撇号的源代码略有变化。它的外观和行为因复制源和粘贴源的不同而不同。这是正常的吗？有没有办法确保每件事都以同样的方式呈现撇号？这是windows的东西吗？我觉得这是一个新事物，但也许它一直都是这样的。

浏览 5提问于2011-02-05得票数 1

回答已采纳

2回答

如果这两个撇号都存在于Python中，Regex就会移除它们。

python-3.x、regex

我刚从Regex辞职，但我的文本挖掘脚本几乎完成了。只有一件事失败了:如果一个单词存在的话，我试图删除它们之间的撇号。我用re.sub来做这个。例如： ‘apple’需要是apple‘apple’‘apple’‘apple’需要是(苹果) 然而，苹果需要保持苹果的地位，因为只有一个撇号。如果中间有一个单词，我如何选择这两个撇号，以便我可以用re.sub删除它们？在每一次尝试中，我都会删除整个字符串！希望有人能帮忙。我的代码如下： str_o='\'Apple\'' str_o_a = re.sub(r"\'(.*?)\'"

浏览 5提问于2022-10-04得票数 -1

2回答

如何处理javascript中regex字界的收缩

javascript、regex、node.js、word

我有一个nodejs脚本，它读取文件并计数单词频率。我目前将每一行输入到一个函数中： function getWords(line) { return line.match(/\b\w+\b/g); } 这几乎匹配所有的东西，除了它没有宫缩。 getWords("I'm") -> {"I", "m"} 但是，我不能仅仅包括撇号，因为我希望匹配的撇号是单词的边界： getWords("hey'there'") -> {"hey", "there"} 是否有一

浏览 1提问于2014-12-31得票数 6

1回答

字符集问题UTF-8

python、python-2.7、utf-8、character-encoding、special-characters

我有一个文档，其中的单词“word”包含了如下所示的撇号。当我试图通过python程序处理这个问题时，它会将单词显示为“mentioned”，并按照下面提到的错误退出。 UnicodeDecodeError: 'utf8' codec can't decode byte 0x92 in position 70: invalid start byte 我在记事本中打开了文档，并将编码从ANSI更改为UTF-8 (在网上找到)，现在它工作正常。但是，有人能说清楚，所有这些都是关于什么的，以及我如何用我的笔记本键盘输入那种撇号。

浏览 0提问于2016-03-16得票数 0

回答已采纳

2回答

解析新奇文本的正则表达式

regex、file-io

我正在尝试从一个包含小说文本的文件中读取内容。我想读每一个连续的单词，但当然，小说中有标点符号的事实使这一点变得困难。我只需要读小说中的单词，所以忽略像"，“这样的字符！”和"?"，但我需要包括某些非字母字符，如撇号，它们实际上是单词的一部分。我不太擅长正则表达式，但我的感觉是这个正则表达式只捕获字符，而不考虑撇号： [^A-Za-z]+ 有没有人能帮我弄一个正则表达式，它可以用单词分隔，忽略标点符号，但保留撇号和其他组成单词的字符？

浏览 1提问于2012-09-18得票数 0

回答已采纳

1回答

什么是&#39；谷歌搜索为什么要用撇号代替它？

html、google-search、apostrophe

-散列-三-九-分号(')用什么语言表示撇号？我有一些以JSON格式提取的网站数据，其中一些用户评论带有撇号，这些撇号被'替换。那么，这是什么表现呢？我甚至不能谷歌它作为谷歌搜索撇号，而不是-散列-三九分号。

浏览 1提问于2015-03-28得票数 41

回答已采纳

4回答

如何删除字符串中的单引号，只留下单词？

ruby、regex

我想从字符串中删除单引号，但不想删除撇号的引号。例如，我想要转换为： "I'm a very 'dumb' stackoverflow user." #=> I'm a very dumb stackoverflow user. 所以像string.gsub("'", "")这样的东西不会起作用，因为它替换了所有的单引号。不应替换"I'm中的'“。

浏览 0提问于2016-07-13得票数 0

2回答

Regex不会像预期的那样匹配单词

javascript、regex、xregexp

根据以下条件，我试图使用来测试字符串是否为有效单词：字符串以一个或多个Unicode字母开头，然后是一种撇号(')，后面跟着一个或多个Unicode字母，重复0次或多次。字符串在匹配的模式之后立即结束。也就是说，它将符合这些条件。你好，安拉‘’t‘O’‘reilly不能但不是这些吃到我在尝试这个模式， ^(\\p{L})+('(\\p{L})+)*$ 但是它不匹配任何包含撇号的单词。我做错了什么？编辑:使用regex的代码 var separateWords = function(text) { var word =

浏览 3提问于2012-08-06得票数 2

2回答

ORA-00907:在C#中缺少带有SQL语句的右括号

c#、oracle

当运行以下查询获取上述错误时， String sql = "((NAME= '" + sReceipts[0] + "' ) OR (SECTION IN ('RECEIPT', 'PROJECT') AND NAME IS NULL))"; sReceipts[0]值是“Tom‘s”(带有撇号)，给出错误但如果sReceipts = 'Ann‘，则不会出现错误。我试着用String.Format解决问题，但我做不到。请问最好的方法是什么？

浏览 2提问于2017-09-27得票数 0

4回答

如何使用Java正则表达式将带有撇号的单词算作两个单独的单词

java、regex

我有一个字符串，它有一个带撇号的单词。他是个非常非常好的男孩，不是吗？ public class Solution { public static void main(String[] args) { String s = "He is a very very good boy, isn't he?"; String[] words = s.split("\\s+"); int itemCount = words.length; System.out.

浏览 0提问于2016-08-20得票数 2

4回答

计算连字符和撇号单词的正则表达式

regex、string

如何修改此正则表达式以将包含连字符或撇号的单词计算为一个单词？ @"^(\w+\b.*?){numOfWords}" 谢谢! 编辑:我试图让这个表达式返回前n个单词，同时将带有‘或连字符的单词计数为一个单词 string substringWords = Regex.Match(stringWords, @"^(\w+\b.*?){" + numberOfWords + "}").ToString();

浏览 3提问于2016-03-09得票数 0

1回答

在python中进行网络抓取时，如何过滤掉unicode字符？

python、web-scraping、python-unicode

所以，每次我在oed.com上抓取这个网页时，我都会得到一些看起来像unicode字符的小撇号。我如何过滤我的代码并用普通的撇号替换所有这些字符？下面是我用来打印我的单词列表的代码(如果你没有登录这个网站，多次抓取会显示重复的单词)。 import csv import os import re import requests import urllib2 year_start= 1550 year_end = 1560 subject_search = ['Law'] with open("/Applications/Python 3.5/Economic/OED

浏览 0提问于2016-11-28得票数 0

2回答

多字节字符串的Regex字界

regex、unicode

我在我的搜索应用程序上使用posix c regex库(regcomp/regexec)。我的应用程序支持不同的语言，包括使用多字节字符的语言。在使用单词边界元字符(\b)时，我遇到了一个问题。对于单字节字符串，它工作得很好，例如： “b”与“纸张”相匹配但是，如果regex和查询字符串是多字节的，则它似乎不能正常工作，例如： “b紙張\b”与"紙張“不匹配我是不是遗漏了什么？任何帮助都将不胜感激。请求的信息：编程语言: CRegex Library: GNU (regex.h) 谢谢。

浏览 1提问于2009-03-10得票数 3

回答已采纳

1回答

用regex忽略某些字符

regex、pcre

我正在读取一个文本文件，在该文本文件中，我将单词添加到数据结构中，并有以下一行。 “看曲然的季节到了” 我试图用regex从tis中删除撇号，但我想把它保留在可兰经的位置上。我基本上希望regex表达式忽略字符之间的撇号。我有类似的东西，但我对Regex很陌生。任何关于我应该做什么或者我应该看什么正则表达式的想法。 ('\w)|(\w+'\w+) 它强调的词只有撇号，但我似乎不知道如何“否定”第二个表达式。

浏览 0提问于2018-11-14得票数 0

回答已采纳

2回答

将此正则表达式代码应用于带有撇号的单词。

php、regex、preg-replace、preg-match

我使用这段代码在一个单词的两边选择两个单词。 ((\w+\W+){0,2}WORDHERE(\W+\w+){0,2}) 但它将撇号分隔词视为“两个词”。例如，使用输入文本：你不是世界上最好的世界上最糟糕的人肯定没有赢结果是：你不是世界上最好的世界上最糟糕的肯定没赢如何使这段代码理解带有撇号的单词应该被视为一个单词？

浏览 4提问于2020-09-26得票数 1

回答已采纳

4回答

使用preg_replace函数删除字符

php、preg-replace

我使用preg_replace函数。我希望函数不删除撇号(')字符。所以我要它把单词返回为(点钟)。我怎么能这么做？ $last_word = "o'clock."; $new_word= preg_replace('/[^a-zA-Z0-9 ]/','',$last_word); echo $new_word;

浏览 5提问于2012-07-26得票数 0

回答已采纳

1回答

KRL RSS解析器:处理编码问题？

character-encoding、krl

我正在将Tumblr中的RSS feed导入到Kynetx应用程序中。RSS提要似乎有一些编码问题，因为撇号看起来像这样：这个提要(您可以找到)声称是用UTF8编码的。有没有办法指定编码，或者用常规的撇号替换这些字符？

浏览 2提问于2011-01-20得票数 2

回答已采纳

2回答

怎样才能去掉撇号？

python

我正在传递一个文本文件，我希望去掉所有可能的单引号。我正在使用以下函数： def apost(nostop): for n in nostop: final=[] removed=[] for y in n: r=remove_apos(y) final.append(r) removed.append(final) print("Task 2: Apostrophy removed!") return removed 这是remove_apo

浏览 4提问于2016-03-02得票数 0

1回答

如何去除url中的小段和撇号

8、path-aliases

我用的是drupal 8和Pathauto。我有Personnes d'Allemagne类型的标题(法语)，我想删除d'，使其具有url personnes-allemagne。 Pathauto很好地删除了撇号，但在此之前保留了粒子，这给了people-dallemagne。我试图添加删除d'或仅删除d的单词，但它不起作用。Pathauto继续只删除撇号，而不删除d。我想用破折号代替撇号，但我更喜欢删除粒子和破折号。有人有解决办法吗？

浏览 0提问于2019-03-11得票数 1

回答已采纳

1回答

已尝试在Java中从字符串中删除撇号

java、regex

我试图用空格替换所有没有被字母括起来的撇号。对于像it's这样的情况，撇号不会被替换。我已经尝试过了： str.replaceAll("[^a-zA-Z](')", " ") .replaceAll("(')[^a-zA-Z]", " "); 然而，仍然有一些情况下不能工作，我也认为应该有一个更优雅的方式来做到这一点。谁能帮帮我？

浏览 0提问于2016-11-03得票数 1

1回答

使用PHP删除字符串中的标点符号，但不是收缩中的标点符号

php、regex

我正在编写将文本分解为单词的代码，并执行计算单词大小等操作。我想出了这个(在一些搜索之后)： $text = preg_replace("/[^[:alnum:][:space:]]/u", ' ', $text); $words = mb_split( ' +', $text ); 然而，缩写不起作用，因为撇号和单引号看起来是一样的(因为它们是一样的)。我需要一种方法来区分单词，但包括缩写。现在，我已经包括了我能想到的所有的收缩，但这是最不令人满意的。我对正则表达式不太在行，需要一些建议。尽管我发布了我自己的不优雅的解决方案，但我将这个问

浏览 0提问于2019-05-23得票数 0

2回答

使用命令行打印唯一单词的数量

shell-script

我有家庭作业：找到几个独特的词和他们的计数文件爱丽丝？将排序后的唯一单词打印到名为alice_unique的文件中。注意，当你用撇号分割单词时，它们正确地分开，与任何其他特殊字符一样。到目前为止我有这个， tr -sc 'A-Za-z' '\012' < alice | sort | uniq -c > alice_unique 但我不知道如何保持单词的特殊字符('，!，？等等)在一起。或如何计算唯一单词的总数。文本文件Alice (开头) 爱丽丝在仙境中的冒险--千禧年支点版3.0章--“兔子下洞”爱丽丝开始厌倦了坐在她姐姐旁边，无所

浏览 0提问于2017-02-03得票数 1

回答已采纳

1回答

替换不在word中的引号

java、regex

我有一个很长的字符串，里面有几个单词。这些词中有些有撇号。别这样。有些词在单词外有撇号，例如“电影是伟大的”或“大量的撇号”。我想删除所有不属于这个词的撇号。例如，在字符串=不要尝试‘中删除使徒’word‘。输出应该是不要试图移除word中的apostr。 I wrote the regex for it .*[^a-z]'[^a-z].* But I am not getting the desired output in my java code. String s = "don't try to ''''remove

浏览 5提问于2016-11-05得票数 2

回答已采纳

3回答

Unicode字符和被错误地显示为‰š和‰

python、unicode、utf-8、mojibake

我有一个带有西班牙文本的UTF-8文件，一些带有重音标记的单词在一些软件中显示错误。我相信我的档案是正确的。例如，名称‘JES’被编码为4A 45 53 C3 9A 53。 >>> b'\x4A\x45\x53\xC3\x9A\x53'.decode('utf-8') 'JESÚS' 根据c39a，\u00da是正确的UTF-8编码. 那么，为什么有些软件不正确地呈现它呢？

浏览 10提问于2015-12-23得票数 1

回答已采纳

1回答

自动热键脚本中撇号的Regex匹配

html、regex、escaping、autohotkey、apostrophe

我有一个自动热键脚本，当我双击网页上的任何单词时，它会在双语词典中查找一个单词。如果我点击类似于" l‘homme“的东西，l’就会被复制到剪贴板和人形中。我想要自动热键脚本去掉所有的东西，包括撇号。我找不到自动热键来匹配撇号。下面是一个示例脚本，它输出前四个字符的ascii值。如果我在上双击“l‘’homme”，它会打印出: 108,8217,104,111。第二个字符显然不是撇号的ascii代码。我认为这很可能与撇号的HTML表示有关，但我一直未能找到它的底端。我试过使用自动热键的转换，HTML函数，没有任何运气。我已经尝试了Unicode和非Unicode版本的自动热键。我在

浏览 2提问于2012-09-07得票数 4

回答已采纳

2回答

尾部和前面的撇号

java、regex

我以前已经问过一个类似的问题，但我想知道是否有一个正则表达式来解析字符串，以便提取数字和字符串时忽略所有标点符号，但允许每个单词都有一个撇号，无论是在开头、中间还是结尾。 String problem = "'Cause I''m lo#o@kin' t%o ext!r$act a^ll 8 su*bs(tr]i{ngs."; String[] solve = {"'Cause", "I'm", "lookin'", "to", "extract&#

浏览 3提问于2015-03-23得票数 0

2回答

使用正则表达式分离列表？

regex、csv、replace

我有一个由系统生成的CSV文件。问题出在其中一个字段，该字段过去是一个项目列表。以下是原始列表的一个示例... The serial number of the desk is 45TYTU This is the second item in the list The colour of the apple is green The ID code is 489RUI This is the fourth item in the list. 不幸的是，系统输出的代码如下…… The serial number of the desk is 45TYTUThis is the second i

浏览 0提问于2011-12-14得票数 0

1回答

Python从文件中读取文本没有找到撇号

python、text、encoding、nlp、readfile

用于清除文本的函数 def clean_before_tok(text): text=text.replace("'"," ") exclude=[" le "," la "," l "," un "," une "," du "," de "," les "," des "," s "," d "] for e in exclude: te

浏览 1提问于2022-02-28得票数 -1

回答已采纳

3回答

Python Regex:仅当放在字母内时才使用撇号，而不是作为引号

python、regex

将每个单词定义为字母字符(或仅字母)的最长连续序列，如果撇号夹在两个字母之间，则最多包括一个撇号。 [a-z]+[a-z/'?a-z]*[a-z$] 它与字母'a‘不匹配。

浏览 2提问于2020-02-18得票数 0

3回答

删除带有疯狂符号的行

python、nlp、preprocessor

我有一个句子列表，我相信其中一些句子的编码是错误的。有些句子现在包含像‘h’©这样的字符串。我想删除所有的句子，包含像这样带有疯狂符号的单词。我已经尝试了下面的代码，它已经部分工作了。很多我想要删除的句子已经被删除了，但不是所有的。有什么想法吗？ clean_sentences = [] lines_to_erase = [] characters = "Ã©Â�Ä¢¬" for line in all_data: for char in line: if char in characters: lines_to_erase.append(l

浏览 2提问于2021-03-08得票数 1

4回答

如何修复使用不同编码方式的页面中的无效HTML字符？

html、utf-8、character-encoding、ansi

我有许多网站正在呈现无效字符。页面的元标记指定UTF-8编码。但是，许多页面包含的字符不能被UTF-8解释，这可能是因为文件是用另一种编码(例如ANSI)保存的。我现在特别关注的是一个花哨的撇号(如在"Bob’s"...sorry中，如果没有正确显示)。W3的验证器表示该实体为"\x92"，但它不会验证该文件，因为它没有映射到unicode。当然，如果我在Notepad++中打开文件并将编码更改为UTF-8，则该字符将被黑匣子中的92替换。我的问题是:最简单的解决方法是什么？我必须打开所有的页面并用一个传统的撇号替换这个字符吗？或者我可以添加一个快速修复(例如

浏览 6提问于2010-09-30得票数 8

回答已采纳

1回答

在Weblogic中创建完全正常工作的jaas_config文件

weblogic、jaas

我的问题是，我正试图在Weblogic中创建一个有效的jaas_config文件。只要我在配置文件中有一行，就可以了。 MyServices { com.example.myservices required;}; 但当我键入更多行时，我总是会收到 No Configuration was registered that can handle the configuration named MyServices 这是我的完整文件： MyServcies { com.example.myservices required debug=true programName=My First Progr

浏览 0提问于2018-04-11得票数 0

16回答

撇号的HTML代码

html、ascii

看起来很简单，但我在网上找不到任何相关的东西。撇号的正确HTML代码是什么？是’吗？

浏览 1提问于2009-01-07得票数 236

回答已采纳

3回答

如何使用扫描分隔符(包括Java中的单引号或撇号)从文本文件中筛选出非字母

java、java.util.scanner、delimiter

我想保留一个文件中的每个单词的计数，这个计数不应该包括非字母，如撇号，逗号，句号，问号，感叹号，e.t.c。也就是说，只是字母表中的字母。我尝试使用这样的分隔符，但它没有包括撇号。 Scanner fileScanner = new Scanner("C:\\MyJavaFolder\\JavaAssignment1\\TestFile.txt"); int totalWordCount = 0; //Firstly to count all the words in the file without the restricted characters

浏览 1提问于2010-11-10得票数 2

回答已采纳