腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
正则表达式
检测
可能
带有
撇
号
的
单词
,
这些
单词
是
用
ASCII
编码
的
吗
?
python
、
html
、
regex
、
text
、
ascii
在Python中工作时,我正在尝试创建一个函数,该函数接受股票代码作为字符串,并
使用
从Yahoo!金融。除了一个包含
撇
号
的
公司之外,我已经让它在所有的公司都能工作。我检查了html代码,发现
撇
号
是
这样
编码
的
--我非常确定它是
用
ASCII
编码
的
。下面
是
html代码
的
修改版本: html = '<!我得到
的
浏览 19
提问于2020-01-29
得票数 0
2
回答
单词
边界
的
JavaScript
正则表达式
,允许在
单词
连字符和
撇
号
中
使用
javascript
、
regex
、
word-boundary
我正在为JavaScript寻找一个
正则表达式
,它将识别英语中
的
单词
边界,同时接受出现在
单词
中
的
连字符和
撇
号
,但不包括单独出现或出现在
单词
开头或结尾
的
那些。亲水相Shesaid- 'That‘llbeall,Two-Fry.' 如果我
使用
regex /[^A-Za-z'-]/g,则不会<em
浏览 3
提问于2016-08-13
得票数 0
回答已采纳
4
回答
匹配
单词
和
带有
撇
号
的
单词
的
正则表达式
regex
、
python-3.x
我正在寻找一个
正则表达式
来匹配以下逐字语句:在开头和结尾
带有
撇
号
的
单词
将与
单词
匹配,而不带
撇
号
浏览 2
提问于2010-04-08
得票数 14
1
回答
只替换输入文件中
的
某些
撇
号
的
Java Regex
java
、
regex
、
string
、
replaceall
、
inverted-index
我已经能够
使用
String[] words = value.toString().replaceAll("[^a-zA-Z ]", " ").toLowerCase().split("\\s+");我在用空字符串替换特殊字符时遇到了一些麻烦,因为这会导致一些
单词
合并在一起,所以我在上面的代码中用空格替换了它们。但是,
使用
上面的代码仍然没有给出我想要
的
输出,因为它将
带有
撇
号
的
单词</e
浏览 4
提问于2021-11-20
得票数 1
回答已采纳
1
回答
在Perl脚本中打开行长度
perl
我想在Perl中
使用
switch/case结构。我有一个包含
单词
序列
的
文件,我想根据行包含
的
单词
数对每一行进行不同
的
处理。一个示例文件:w1 w3 所以脚本看起来会像这样,但是我如何计算每行
单词
的
数量呢?
浏览 2
提问于2017-05-10
得票数 3
回答已采纳
3
回答
更正现有
正则表达式
/创建一个新表达式
java
、
regex
、
string
我正在努力学习
正则表达式
,并试图
用
空格替换字符串中
的
值,
使用
正则表达式
将其输入令牌程序。字符串
可能
包含许多标点符号。但是,我不想替换字符串中包含
撇
号
/连字符
的
空格。例如,He's => He's最初,我试图
用
空格替换所有标点符号,但这行不通。我试图通过指定
单词
边
浏览 6
提问于2014-10-21
得票数 2
2
回答
用
nbsp替换连字符周围
的
空格
php
、
regex
我需要(
可能
) regexp (或两个)来做以下工作: 然而,我发现这个,如果有
撇
号
的
单词
(就像有),以前
的
regexp‘认为's’后面的
撇
号
是
一个字母(这是不对
的
)。我只想/只需要一个字母之后
的
空格,不需要任何其他字母(不要在
单词
后面,不要在
带有
<
浏览 6
提问于2011-07-25
得票数 2
回答已采纳
1
回答
用
正则表达式
标记时区分引号和
撇
号
python
、
regex
有了一些文字,我想正确地标记它在
单词
上。在案文中
可能
出现: 文本在句子上
是
分裂
的
,但在一个引语中可以是许多句子,还有,
带有
撇
号</
浏览 1
提问于2018-01-30
得票数 2
1
回答
unnest_tokens -如何在
单词
的
开头或结尾保留
撇
号
?
r
、
unnest
我试图
用
一些不寻常
的
拼写来创建一个语料库,我想保持
这些
拼写。例如,如果有什么东西而不是某物
的
实例,我想保留
撇
号
。当然,在没有
撇
号
的
情况下,还是很容易发现
的
,但是也有这样
的
情况,比如哪里变成‘,但是没有
撇
号
,它被误认为
是
a,就像在大象中一样。这可以是在
单词
的
开头或结尾,例如,它们
的
意思
是
浏览 6
提问于2022-08-20
得票数 0
2
回答
我如何允许或忽略
撇
号
?
regex
、
vb.net
我正在寻找允许(或忽略)
撇
号
的
正则表达式
吗
?我对regex相当陌生,我也看过其他类似的问题,但没有找到我需要
的
帮助。我
使用
文本框搜索RTB,并将所有
单词
与特定或共同
的
结尾(即插入textbox中
的
搜索词)匹配。然后,我需要把所有的比赛传递给第二个RTB。我尝试过许多不同
的
表达式,包括:\b\w*[-']\w*\b,但是程序要么在
撇
号
处分隔
单词</
浏览 2
提问于2019-12-17
得票数 0
回答已采纳
3
回答
使用
regex匹配给定
单词
中
的
子字符串(
撇
号
)
php
、
regex
我有一个服务器应用程序,它查找俄语
单词
中重音
的
位置。最终用户编写一个
单词
жажда。服务器从另一个服务器下载一个页面,该服务器包含每个案例/解密(如жа'жда )中用
撇
号
指示
的
压力。我需要在下载
的
页面上找到那个词。 在俄语中,重音总是写在元音后面。到目前为止,我一直在
使用
一个
正则表达式
,它是由所有
可能
的
组合组成
的
(жа'жда|жажда'
浏览 1
提问于2014-10-17
得票数 2
1
回答
我可以在一个HTML文本区域中高亮显示多个无法在Javascript中执行
正则表达式
的
单词
吗
?
javascript
、
textarea
、
highlighting
基本上,交易
是
这样
的
。 我正在
使用
的
应用程序,它
使用
的
数据库显然不能接受HTML文本中
的
非US-
ASCII
字符作为输入域。现在,我们
的
用户在将PDF文档中
的
文本复制/粘贴到
这些
字段时遇到了问题。我们
的
研究发现,某些字符,如PDF文档中
的
左右单引号、
撇
号
和双引号字符,当粘贴到文本区时,会以某种方式转换为不同
的</
浏览 0
提问于2011-08-09
得票数 0
1
回答
如何
使用
CoreNLP
的
RegexNER
检测
有超过一个
单词
的
命名实体?
stanford-nlp
我正在CoreNLP中
使用
CoreNLP注释器,我
的
一些命名实体由多个
单词
组成。摘自我
的
映射文件: 吉尔伯特综合征 第一个
单词
被
检测
到,但是每个
单词
都得到注释DRUG_CLASS,并且似乎没有办法链接
这些
单词
,就像两个
单词
都有一个NER一样第二种情况根本没有被
检测
到,这
可能
是因为令牌程序将Gilbert后面的
撇
号<
浏览 0
提问于2017-03-29
得票数 2
回答已采纳
3
回答
我如何区分在python中
使用
regex
的
单词
,同时考虑
带有
撇
号
的
单词
?
python
、
regex
我尝试在python中
使用
单词
边界来分离m,并将它们全部找到。
这些
m应该两边都有一个空格,或者开始/结束字符串:re.findall(r, someString) 然而,由于
撇
号
被认为
是
单词
的
边界,这种方法也能在
单词
如何编写不将
撇
号
视为
单词
边界
的
正则表达式
?我试过
浏览 3
提问于2013-10-12
得票数 1
回答已采纳
2
回答
去掉单引号并保留
撇
号
的
正则表达式
java
、
regex
、
grep
、
apostrophe
我想从文本文件中解析
单词
。应保留
撇
号
,但应删除单引号。以下
是
一些测试数据:我正在尝试
使用
grep,如下所示:它会产生:is'challenge' 需要去掉
单词
challenge周围
的
引号。正确/所需
浏览 0
提问于2012-03-22
得票数 2
回答已采纳
1
回答
在列表中
检测
专有名词
的
正则表达式
python
、
regex
、
word-frequency
我有一个程序可以显示文本中
单词
的
频率列表(标记文本),但我首先要:
检测
文本
的
专有名词并将它们追加到另一个列表(Cap_nouns)中;其次:在另一个列表(错误)中追加字典中没有的名词, 稍后,我想为
这些
错误创建一个频率列表,并为找到
的
专有名词创建另一个频率列表。我
检测
专有名词
的
想法
是
查找以大写字母开头
的
项目,并将它们追加到这个列表中,但似乎我
的
这个任务
的
正则表达式
浏览 0
提问于2019-03-20
得票数 1
回答已采纳
2
回答
我对RegEx如何区分
撇
号
和单引号感到困惑
javascript
、
regex
我试图更好地理解RegEx和
撇
号
/单引号。如果我
使用
这个代码:console.log(phrase.match(regex))let phrase = "'pickle'" //text/g
的
意思
是
斜杠之间
的
所有东西,g表示全局
的
,继续搜索第一个hit.\b
是
单词</e
浏览 2
提问于2020-07-08
得票数 0
回答已采纳
1
回答
PHP
正则表达式
,用于对URL进行连字符连接,但忽略卷曲
撇
号
php
、
regex
、
drupal-7
一些旧
的
页面标题在诸如what's之类
的
单词
中包含卷曲
撇
号
。 在进行这次迁移时,我们更改了很多URL,以简化站点布局并使URL更加直观。我正在尝试设置一个转发系统,该系统捕获对旧URL
的
请求,然后将用户重定向到基于新页面标题
的
新URL。除了标题中包含卷曲
撇
号
的
页面之外,这种方法工作得非常好,因为Drupal在它创建
的
urls中对
这些
卷曲进行了
编码
,但是我
浏览 3
提问于2017-02-07
得票数 0
1
回答
HTML中正确
使用
的
撇
号
类型
html
、
character-encoding
、
apostrophe
如果我
用
键盘将一段文字直接写入HTML文档
的
文本编辑器中,并且其中一个
单词
有
撇
号
,那么
撇
号
的
写法将完全如下所示:Hereʼs an example of some text. 在HTML文档中显示它们
的
正确方法是什么?正如我通常所做
的
那样,查找和替换使它们与'相同。此外,我还
浏览 1
提问于2017-10-31
得票数 2
1
回答
使用
RegEx在Embarcadero
的
C++ Builder中将文本分割成单个
单词
c++
、
regex
、
string
、
c++builder
我正在
使用
Embarcadero
的
C++ Builder开发一个拼写检查程序。我
使用
正则表达式
将文本分割成单个
单词
。下面的代码在中工作得很好,但与RADStudio西雅图
的
行为方式不同。当
单词
中包含非拉丁语字符,如德语Umlauts (à,à,The )或
带有
重音
的
字符时,就会出现这个问题。“w”被解释为忽略非拉丁字符
的
a-Za-Z0-9。 首先,在我
的
上下文中,什么
是
单词
浏览 4
提问于2016-08-30
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Stata:正则表达式和文本分析
人工智能实现程序员“防”BOSS?刷脸就发短信,8行代码人脸报警
正则表达式的功法大全,做NLP再也不怕搞不定字符串了
Python语言特点
正则表达式教程:实例速查
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券