腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
dataframe
中
使用
str.contains
和
正则表达式
搜索
单词
很慢
,
有没有
更好
的
方法
?
python
、
regex
、
pandas
、
dataframe
、
jupyter-notebook
我有一个超过200万行
的
数据库。我尝试
使用
regex查找同时包含这两个
单词
的
行,如下所示: df1 = df[df['my_column'].
str.contains
(r'(?=.*second_word)')] 然而,当试图
在
jupyter notebook
中
处理它时,它要么需要超过一分钟
的
时间来返回这些行,要么它会使内核崩溃,我必须再试一次。
有没有
更有效
的
方法</e
浏览 67
提问于2021-01-27
得票数 1
回答已采纳
1
回答
如何向
dataframe
添加列,条件是我
的
dataframe
中
的
某些观察包含Python
中
的
目标
单词
?
python
、
data-mining
、
dataset
以下是我
的
数据框架
的
样子:1 35 "businessman chairmanmusician (House of Freaks Gutterball)"我想要创建一个额外
的
列.1 3.......87.......base
浏览 0
提问于2017-01-07
得票数 2
16
回答
根据子串标准过滤pandas
DataFrame
python
、
string
、
pandas
、
dataframe
我有一个包含一列字符串值
的
pandas
DataFrame
。我需要根据部分字符串匹配来选择行。像这样
的
成语返回一个布尔值。我熟悉df[df['A'] == "hello world"]
的
语法,但似乎找不到一种
方法
来对部分字符串匹配(比如'hello' )做同样
的
事情。
浏览 8
提问于2012-07-06
得票数 686
1
回答
Python
的
series.str.contains框架中
正则表达式
中
的
变量
python
、
regex
、
string
、
dataframe
、
contains
在运行regex之前,我希望将regex
的
元素作为变量进行控制/编辑。
在
我
使用
的
正则表达式
中
,我希望
在
包含2个
单词
的
数据框
中
查找行,这些行最多由3个
单词
分隔。此代码
使用
不带外部变量
的
正则表达式
标识word1
和
word2:import pandas as pd df = pd.
DataFr
浏览 0
提问于2020-10-15
得票数 0
2
回答
大熊猫巨蟒体内string.contains
的
逆转
python
、
string
、
python-2.7
、
csv
、
pandas
我
的
代码里有这样
的
东西:但是,我想要所有不包含Hello或World
的
行。我如何最有效地扭转这一局面?
浏览 0
提问于2014-01-10
得票数 38
回答已采纳
1
回答
使用
regex按行过滤pandas数据帧
python
、
regex
、
pandas
、
dataframe
我相信可能会有一个简单
的
解决方案,但我对Python还很陌生。我有一个包含字符串
和
NaN值
的
Pandas
DataFrame
。在这个
Dataframe
中
,我想
搜索
字符串
的
特殊部分。这应该逐行完成,找到
的
字符串将被写入与数据帧相同行数
的
列表
中
(这意味着如果我正在查找
的
部分字符串不能在行
中
匹配,则列表
中
的
条目应为'none
浏览 2
提问于2019-02-25
得票数 0
1
回答
将regex格式应用于与大熊猫列匹配
的
术语列表
python
、
regex
、
pandas
我有以下
DataFrame
:2 websocket funny internet4 another one 我试图
使用
正则表达式
与潘达斯
的
str.co
浏览 3
提问于2021-01-27
得票数 2
回答已采纳
7
回答
在
pandas
的
DataFrame
上
搜索
"does-not-contain“
python
、
pandas
、
contains
我做了一些
搜索
,不知道如何通过df["col"].
str.contains
(word)过滤数据帧,但是我想知道是否有相反
的
方法
:根据该集合
的
恭维过滤数据帧。例如:为了!(df["col"].
str.contains
(word))
的
效果。 这可以通过
DataFrame
方法
来完成吗?
浏览 2
提问于2013-06-14
得票数 209
回答已采纳
2
回答
在
python
中
从整个熊猫数据帧中选择
和
删除
单词
列表
python
测试,所以我有一个很大
的
数据集,我想删除所有包含多个
单词
的
行,比如(‘Sample Data’,'TEST','Test'),我不确定该怎么做。我尝试过这样
的
一种方式: test_remove=df[df['Column1'].
str.contains
('test') |df['Column2'].
str.contains
('test')'Test'
浏览 25
提问于2020-07-03
得票数 1
回答已采纳
2
回答
熊猫.基于子串
的
计数
的
表达
方法
python
、
python-3.x
、
pandas
、
pandas-groupby
问题是,“兴奋
和
紧张”应该
和
“兴奋”放在一起。事实上,包含“兴奋”
的
字符串应该包含在一个组
中
,但“不那么兴奋”
和
“不兴奋”这样
的
字符串除外。同样
的
逻辑也适用于“担心”
和
“紧张”。(请注意,“兴奋
和
紧张”实际上属于“兴奋”
和
“紧张”两类) 您可以看到,典型
的
groupby不能工作,字符串
搜索
必须灵活。我有一个解决方案,但不知道你们是否都能找到一种
更好
的</e
浏览 2
提问于2018-07-18
得票数 3
回答已采纳
1
回答
在
pandas
中
搜索
列
中
的
字符串不起作用
python
、
regex
、
pandas
我试图
在
我
的
pandas
dataframe
中
搜索
以下字符串,但它无法找到该字符串,即使它存在于数据帧
中
。我
的
代码是:df_temp['name'].
str.contains
('Wilkes, Mrs.James (Ellen
浏览 0
提问于2018-07-14
得票数 0
3
回答
统计pandas数据帧
中
每个特定
单词
的
出现次数
python
、
pandas
、
dataframe
我想要计算数据帧
中
每个特定
单词
的
出现次数。我目前
使用
的
是
str.contains
n = a.apply(lambdax: 1).sum()
有没有
一种
方法
可以匹配
正则表达式
并获得出现次数?
在
我
的</
浏览 0
提问于2013-07-10
得票数 33
回答已采纳
3
回答
使用
str.contians查看列表
中
的
单词
在
每个项
中
python
、
pandas
、
contains
我正在尝试提取
在
str.contains
()
搜索
中找到
的
单词
,如下图所示(但
使用
的
是熊猫
和
str.contains
,而不是VBA)。我试图
在
VBA结果列
中
重新创建输出。searchfor = list(terms['term']) found = [reviews[
浏览 0
提问于2020-01-29
得票数 2
回答已采纳
8
回答
搜索
所有Pandas
DataFrame
列
和
过滤器
中
的
字符串
python
、
pandas
本以为这将是直截了当
的
,但有一些困难,找到一种优雅
的
方法
,
在
同一时间
搜索
数据
中
的
所有列,以获得部分字符串匹配。基本上,我将如何将df['col1'].
str.contains
('^')应用于整个数据帧,并筛选到包含匹配记录
的
任何行?
浏览 8
提问于2014-10-29
得票数 60
回答已采纳
1
回答
如果只有句子包含来自
搜索
列表
的
任何关键字,则从数据框文本列中选择句子
python
、
python-3.x
、
regex
、
pandas
、
nltk
我有一个数据框架,
在
一列
中
,我有一个全文,其中有多个非常长
的
句子。我
使用
NLTK对文本进行标记化,但现在我需要确保只从给定
的
完整
单词
的
长列表中提取包含任意
单词
的
句子。我写了下面的代码,但它
的
问题是,它不是作为一个整体检查文本
中
的
单词
,而是例如在
搜索
列表
中
找出一个给定
的
单词
,比如'ti
浏览 0
提问于2020-10-17
得票数 1
2
回答
Pandas
DataFrame
子集上
的
字符串修改
python
、
regex
、
pandas
我很难更新Pandas数据框子集中
的
字符串值
在
字段操作
中
,我可以
使用
正则表达式
修改action列: df['action'] = df.action.str.replace('([^a-z0-9\._]{2,})','') 但是,如果字符串包含特定
的
单词
,我不想修改它,所以我尝试只更新一个子集,如下所示: df[df['action'].
str.contains
(
浏览 22
提问于2020-04-16
得票数 0
回答已采纳
3
回答
熊猫-
搜索
术语(不管
搜索
词
的
上下大小写如何)
python
、
python-3.x
、
pandas
下面的代码
搜索
整个
Dataframe
中
的
字符串。df[df.apply(lambda x: x.astype(str).
str.contains
(search)).any(axis=1)] 然而,我有一个问题,如果
搜索
小组是大写字母,它就失败了。
有没有
任何
方法
可以
搜索
整个
Dataframe
,而不管
在
Dataframe
中
的
搜索
词是
浏览 4
提问于2018-11-14
得票数 1
回答已采纳
2
回答
熊猫如何扫描字符串
中
包含
的
一行?
python
、
pandas
我想要得到包含在
dataframe
中
的
行,比如"ball“,并获取ID。 因此,结果将是ID 'AA‘
和
ID 'AD’,因为AA_balls
和
AD_ballss在行
中
。我
在
谷歌上
搜索
过,但似乎没有具体
的
结果。人们通常问有关在特定列
中
搜索
子字符串
的
问题,而不是所有列(一行)
中
的
搜索
问题。(2)将名称2
浏览 1
提问于2018-03-16
得票数 1
回答已采纳
1
回答
正则表达式
搜索
-另一个
单词
中
的
单词
regex
我有一个
搜索
要求。例如,我想在大量内容
中
搜索
单词
"Microsoft Account“。
在
大文本
中
,它可能被定义为"Microsoft_Account“或"Microsoft-Account”。我
的
搜索
逻辑也应该识别上面的
单词
。
有没有
办法用
正则表达式
来实现呢?(可以通过拆分
和
循环
搜索
来完成,但如果有任何
使用
正
浏览 2
提问于2018-11-23
得票数 0
2
回答
如果另一列
中
存在字符,则有条件地更新
dataframe
列
python
、
pandas
、
dataframe
我有一个
dataframe
,它由两个列组成,全名
和
姓氏。有时,姓氏列
的
填写不正确。在这种情况下,
在
括号之间
的
全名列
中
,姓氏将被视为最后一个
单词
。如果发现括号等于括号之间
的
单词
,我想更新我
的
姓氏列。代码df = pd.
DataFrame
({ 'full':['bob john smith','s
浏览 7
提问于2022-04-27
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
你可能不知道的pandas的5个基本技巧
正则表达式太慢?这里有一个提速100倍的方案
觉得正则表达式太慢?这里有一个提速100倍的方案
强大而优雅的正则表达式,老司机搜索必备!
正则表达式的功法大全
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券