腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
pandas
中
的
矢量化
列式
正则表达式
匹配
、
、
、
、
(既不是开始也不是结束,即
匹配
模式'^.+{x}.+$'))) 但是,既然我不是熊猫方面的专家,那么在熊猫
中
似乎没有类似的简单
的
“
矢量化
”
正则表达式
匹配
方法?第二部分 此外,我想提取前导数字(1,2,...)在第一部分中产生
的
匹配
记录
中
: x | y | zfoo | 1.foo-ya | 1bar | 2.bar-ga | 2 在R
中</e
浏览 20
提问于2020-04-26
得票数 2
1
回答
如何优化熊猫数据搜索?
、
我需要在Dataframe
中
搜索'mas‘这个词,用frase
的
列是Corpo,这个专栏
的
文本在列表中被分开,例如:我喜欢鸟-->分离
的
我,就像鸟。因此,我需要搜索‘马斯’在葡萄牙语弗莱斯和抓住只是‘圣诞节’之后
的
单词。代码需要很长时间才能执行此函数。
浏览 1
提问于2018-09-18
得票数 2
回答已采纳
1
回答
如何在python
中
创建基于函数
的
特性?
、
我正在尝试为我正在从事
的
这个数据科学项目(对银行交易数据进行分类)创建一些新功能。例如,我有“自动支付”、“汽油”、“停车”等交易类别,我想创建一个名为“汽车”
的
新功能,其中任何包含这些单词
的
类别都将被赋予1
的
值(而所有其他类别将被赋予0)。我试着为"car“写一个函数,但是我不知道如何根据这个函数
的
结果创建一个新
的
特性。我觉得肯定有一种简单
的
方法可以做到这一点,但我对python还是个新手,在弄明白这一点上有点困难!下面是我
的
car函数:
浏览 0
提问于2018-02-02
得票数 0
回答已采纳
1
回答
从熊猫系列
中
删除
匹配
多个
正则表达式
模式
的
字符串
、
、
、
我有一个
Pandas
dataframe列,其中包含需要清除
的
字符串,这些字符串与各种regex模式相
匹配
。我当前
的
尝试(如下所示)遍历每个模式,创建一个包含
匹配
的
新列,然后循环遍历dataframe,在找到
的
匹配
处拆分该列。然后删除不必要
的
匹配
列“re”。虽然这适用于我目前
的
用例,但我不禁认为,在熊猫
中
,必须有一种更高效、更
矢量化
的
方法来做到这
浏览 4
提问于2016-07-28
得票数 2
2
回答
regex代码,如何解决一些数据输入错误
、
、
JONdf1FARLEYWANG JOSEPHCUCULANDY df['name'].str.upper(*,)',name).group()) 这个
正则表达式
适用于两个df,但是,我刚刚意识到我
的
数据有一个输入错误。在df2<
浏览 2
提问于2020-10-14
得票数 0
回答已采纳
1
回答
Pandas
使用apply()生成特征向量
、
、
我有一个具有两个特性
的
数据集: class (int)和content (text)。{'email':1, 'phone':0, 'curses':1,....}现在我
的
代码是: vectorized = data[['content', 'clas
浏览 0
提问于2015-07-26
得票数 0
4
回答
在熊猫DataFrame
的
滚动切片上应用函数
、
、
、
我想计算2x2矩阵
的
行
列式
,它是通过在Nx2矩阵上滚动一个大小为2
的
窗口而得到
的
。我只是用行
列式
作为一个例子函数。一般来说,我想将一个函数应用到一个数据文件
中
,它是通过窗口化一个更大
的
数据帧来实现
的
。例如,这是一个2x2矩阵,我计算行
列式
如下所示:import numpy as np "X": [1,2],&q
浏览 0
提问于2017-05-15
得票数 7
回答已采纳
1
回答
Dremel或它
的
实现(比如data )如何处理内存
中
的
大型柱状数据布局?
、
我正在通过谷歌
的
。我知道它将复杂
的
数据转换成柱状
的
数据布局。由于memory没有中央元数据存储库,所以我认为它必须是内存
中
的
。 因此,当我有数十亿行时,如何处理这些数据?
浏览 4
提问于2015-08-28
得票数 0
回答已采纳
2
回答
如何使用
Pandas
匹配
正则表达式
模式并将其替换为
匹配
组?
、
、
我有以下
Pandas
系列:SC_S194_M7.CONTROLDAY10.EPI.P1_GobletSC_S106_M1.CONTROLDAY3.EPI2_Goblet 我想使用regex来提取本系列每一行中最后一个下划线之后
的
字符串。我能够想出与最后一个字符串
匹配
的
正则表达式
,但请注意如何在
pandas
系列方法
中
实现
浏览 18
提问于2018-01-29
得票数 1
回答已采纳
2
回答
如何检查字符串是否是
正则表达式
的
有效前缀?
、
,直到流
中
的
下一个字符使其不再与Regex
匹配
为止。想象一下,如果我们想使用带有
正则表达式
的
字符串-42,比如^-[0-9]+$。算法将读取第一个字符-,
匹配
将失败,累加器将为空。 是否有方法检查字符串(例如acc)是否是潜在
正则表达式
匹配
的
前缀?就像-本身不是
匹配
的
,但是-42是
匹配
的
,-是有效
的
前缀。如果它像一个库
的
方式,它
浏览 5
提问于2021-05-26
得票数 1
1
回答
基于字符串
的
部分
匹配
访问序列值
、
称其为国家/地区,ID我想获取与所选国家
的
值相对应
的
ID
的
值。为。例如,我希望它能够查找国家(马来西亚)
的
最后一行,因为它有"subang“
的
部分
匹配
,然后获得相应
的
ID。我试过这个: df.ID[df.
浏览 1
提问于2020-06-26
得票数 0
2
回答
在
pandas
数据帧
中
插入sklearn CountVectorizer
的
结果
、
、
、
我有一堆14784个文本文档,我正在尝试对它们进行
矢量化
,这样我就可以运行一些分析。我使用sklearn
中
的
CountVectorizer将文档转换为特征向量。我这样做是通过调用:features = vectorizer.fit_transform(examples) 其中examples是所有文本文档
的
数组为此,我将这些特性存储在一个
pandas
数据帧
中
。目前,我
的
pandas
数据帧(不插
浏览 0
提问于2016-11-02
得票数 14
1
回答
带可选组
的
模式
、
我有一个有团队
的
模式。这些组都是可选
的
。完全可实现
的
模式是:但也可以像这样==A.A++C.C+D.D-F=B++C-F在组
中
不可能得到行
列式
,例如(A组不可能)。所以我尝试了这些
正则表达式
:问题: 如果缺少组,则不
匹
浏览 5
提问于2015-02-13
得票数 0
1
回答
data.table
中
的
多
正则表达式
匹配
和赋值
、
、
我正在尝试
匹配
一个
正则表达式
,该
正则表达式
输出几个值,并将其就地分配给data.table
中
的
几个新变量library(stringr) 当然,这是失败<e
浏览 2
提问于2017-03-04
得票数 3
回答已采纳
1
回答
Pandas
:将子字符串与字符串列表进行
匹配
、
我有一个熊猫系列中所有美国城市(150k+)
的
列表,比如master_city = pd.Series(['Lake Ketchum', 'Arletta',District 1 1656 Union Street Glenoma 707-445-6600', '1657 Riverside Drive Redding, CA 96001']) 我想看看地址序列
中
的
每个地址是否包含与主城市序列
中
浏览 0
提问于2018-10-28
得票数 0
1
回答
熊猫爆炸以创建新列
、
、
pandas
explode方法为在给定列
的
内部列表中找到
的
每个值创建新行;这是一种逐行分解。
pandas
中
是否已经实现了简单
的
列式
分解,即将df转换为第二个数据帧?
浏览 14
提问于2021-07-05
得票数 0
1
回答
在字符串向量
中
查找子字符串
的
向量
的
第一个
匹配
项(每个重复项)
我有两个字符向量x和y,前者包含后者
的
(潜在)子串,两者都包含重复
的
值。我想为x
中
的
每个元素返回y
中
第一个
匹配
项
的
索引(如果存在),其中子字符串在字符串
的
开头进行
匹配
(cf。^
正则表达式
中
的
锚点),例如: x <- c("Halimid", "Halimid", "Callimid", "Diplid&qu
浏览 0
提问于2020-11-02
得票数 0
2
回答
查找
pandas
.Series
的
值何时至少更改x
、
、
、
我有一个存储为
pandas
.Series
的
时间序列s,我需要找出时间序列跟踪
的
值何时变化至少x。在伪代码
中
: print s(0)for all t in ]t, t_max]: s* = s(t) s_last此
浏览 16
提问于2019-04-18
得票数 4
3
回答
熊猫:检查一个字符串是否包含至少两个单词。
、
我正在使用
Pandas
中
快速
的
、
矢量化
的
Pandas
方法来检查数据
中
的
每一行是否包含--至少有一个单词来自我
的
list_word。True4 True6 TrueName: A, dtype: bool 问题是:如何检查每一行是否至少包含列表
中
的
两个单词我想坚持使用str.contains,因为它比其他pytho
浏览 0
提问于2016-07-27
得票数 2
回答已采纳
2
回答
巨蟒大熊猫:
pandas
.Series.str.match
的
凤仙石
、
如何确定列
中
的
每个字符串是否以
正则表达式
的
匹配
开始。我发现:这几乎是我所需要
的
,但当字符串不
匹配
时,我想得到真。
浏览 3
提问于2021-11-27
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python中的正则表达式及其常用匹配函数用法简介
Java正则表达式匹配所有特殊字符的方法详解
JS正则表达式怎么匹配连续3个重复的数字的
Pandas库中的函数应用和映射
Pandas库在Anaconda中的安装方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券