腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
python
dataframe
.
duplicated
返回
同一
值
的
多个
匹配
项
、
、
、
给定以下数据帧: import pandas as pd 'year36], 'title': ['Ones', 'Twoes', 'Three', 'Four', 'Five', 'Six']}) 我正在尝试获取month专栏中<em
浏览 18
提问于2021-07-06
得票数 0
回答已采纳
2
回答
JavaScript未在数组中检测到indexOf -1
、
、
、
我有一个简单
的
脚本,可以让fixture将数组
的
所有
值
与所有
值
进行
匹配
。inArray) matches.push(z) } })[ 'a', 'b' ] [ 'a', 'c'
浏览 2
提问于2018-01-05
得票数 0
2
回答
Pandas中
的
.
duplicated
()方法在
值
中是否有模糊
匹配
?
、
、
、
我正在为我
的
数据科学课程做一个练习,其中涉及一个数据集,其中包含几条关于Google Playstore应用程序
的
信息。 该练习要求删除任何重复
的
行和列,并填充任何丢失
的
数据。因此,我只检查重复
项
可能有问题
的
列,即dataset
的
“App”列。毕竟,其他数据可以而且很可能会重复,因为它是所有人共享
的
信息,因此我
的
理由是过滤掉'App‘列中
的
重复
项
。通过添加这个序列,我可以得到有多少行是重
浏览 19
提问于2021-06-15
得票数 0
1
回答
如何在Pandas
DataFrame
中找到在某些列中具有相同/相反符号
的
相同
值
的
匹配
行?
、
、
、
、
对于下面的
dataframe
,我如何
返回
第一行和第三行,因为它们在"c“和"d”列中具有相同
的
值
,并且在"a“和”b“中具有相反
的
值
?df1=pd.
DataFrame
([ [1,2,3,4],[5,6,7,8], [-1,-2,3,4]], columns=['a', 'b', 'c', 'd']) 01 2 3 4 1 5
浏览 3
提问于2015-05-27
得票数 1
回答已采纳
1
回答
Dataframe
.
duplicated
() \ Pandas
的
奇怪结果
、
在运行string[
python
]时,我试图在dtype x['comment'].
duplicated
()
的
dataframe
列中查找重复
项
,得到以下输出2Name: comment, dtype: string 如您所见,字符串根本不是重复
的
。因此,我只为这几行重新运行重复
的
函数;x['comment'].iloc[155071:155075].
duplicated
()。我是
浏览 5
提问于2022-10-06
得票数 0
回答已采纳
4
回答
检查Pandas
dataframe
列中
的
重复
值
、
、
、
中有一种方法可以检查
dataframe
列是否有重复
的
值
,而不实际删除行?我有一个函数将删除重复
的
行,但是,我只希望在特定列中实际存在重复
的
情况下运行它。目前,我将列中唯一
值
的
数量与行数进行比较:如果惟一
值
少于行数,则存在重复
值
并运行代码。'].unique()) < len(df.index):是否有一
浏览 5
提问于2018-05-08
得票数 76
回答已采纳
1
回答
如何在一定条件下生成一个numpy数组?
、
、
在某些情况下,我想用它做一个新
的
数组。idx start_lvl end_lvl 67 72 74 我
浏览 3
提问于2019-08-01
得票数 1
回答已采纳
1
回答
如何创建一个For循环,以检查某个列是否包含Pandas
DataFrame
中
的
重复
项
、
、
、
、
我正在尝试创建一个for循环,该循环首先检查列('col1')是否有重复
项
,如果为真,则将另一列('col2')
的
值
添加到('col1')。但是,下面的语句工作正常,所有('col1')
值
都被视为重复
值
。我确信列中
的
副本实际上很少,但不知何故,语句始终
返回
true。我认为问题在于第二行,即包含.
duplicated
()
的
import pandas as
浏览 1
提问于2022-07-11
得票数 -1
1
回答
根据输入数使用dplyr作为过滤器重复使用。
、
、
v1由
多个
标记组成,v2由user_ids组成。一个user_id在v2中可以有
多个
标记(在v1中),如下所示:html pietc# klaas
python
in% v2[
duplicated
(v2)])将很好地
返回
:html pietc# klaas但是,当在第一个过滤器中使用三个
值
时
浏览 0
提问于2018-11-16
得票数 0
回答已采纳
1
回答
在pandas中使用regex验证字符串
、
、
、
、
我是
Python
的
新手(我使用
的
是与Anaconda捆绑在一起
的
3.0版),我想使用regex来验证/
返回
一个只包含符合条件
的
有效数字
的
列表(比如11位数字
的
\d{11} )。['08034382919',11], ['09039292921',11]])for row
浏览 1
提问于2017-07-19
得票数 1
回答已采纳
1
回答
值
计数不适用于对象列。
、
同样基于这个和这个,我尝试计算列中
的
频率。当我在int64列上运行它时:我得到了想要
的
结果:50 1df['text'].value_counts() AttributeError:“
DataFrame
”对象没有属性“value_counts” df.groupby('text').cou
浏览 1
提问于2020-01-13
得票数 0
回答已采纳
1
回答
Pandas:
DataFrame
中重复索引
值
的
平均值
、
、
假设我有以下
DataFrame
: 'b':[4,4,2,4,6,7,8,9]},42010Q2 2 22010Q2 1 62010Q3 3 8注意,每个索引
值
都是重复
的
我想要
的
是
返回
另一个对重复索引行进行平
浏览 0
提问于2018-08-14
得票数 0
2
回答
熊猫:检查不同数据中列之间
的
值
,并将
多个
可能
的
值
返回
到新列中。
、
、
、
我试图比较来自两个不同数据格式
的
两列,并使用
python
返回
所有可能
的
匹配
(类似于excel中
的
xlookup,但有
多个
可能
的
匹配
) 请参阅下面的详细资料样本数据和我尝试
的
工作。我试图查看
dataframe
1 (Marks),并将其与拥有所有其他所有者及其汽车
的
更大数据集进行比较:
dataframe
2(索赔),并
返回
Mark汽车
的<
浏览 2
提问于2022-09-22
得票数 1
回答已采纳
2
回答
Python
熊猫-按行选择
、
、
我试图在熊猫数据帧中根据与另一个数据帧
的
值
相
匹配
的
值
来选择行。关键
的
是,我只想在行中
匹配
值
,而不是整个系列。例如:我希望从df1中选择
浏览 3
提问于2016-11-16
得票数 2
回答已采纳
1
回答
跨栏对熊猫数据进行多重质量检查
、
、
、
、
:123,A25668','B1:TEST,B2456,B3#123','B3:456','B3:678,C1:345','C2:367,C3']})( b)列不应包含缺失
的
值
q_1 = np.where
浏览 1
提问于2021-07-02
得票数 1
回答已采纳
4
回答
使用NA标记冗余行
我有一个包含完整和不完整行
的
data.frame,如下所示: dat <- data.frame( "two" = c(2, 2, NA,4, 4), "four" = c(2, NA, 2, 6, 6) ) 我希望将包含NA
的
行标记为TRUE,其中它们
的
值
等于
同一
列中
的
<e
浏览 53
提问于2020-09-09
得票数 2
回答已采纳
1
回答
如何通过
Python
字典检测/查找.JSON文件中
的
重复
值
、
、
我对
Python
有点陌生,我正在设法找到JSON文件中
的
所有副本。到目前为止,我已经创建了这个
python
脚本来打开和读取JSON文件并解析JSON报告。我需要找到一种方法来查找所有可能
的
重复事务,并打印每一行以包含日期、数量、描述和transactionID。请告诉我,如果我在正确
的
道路上,任何建议或指示都会有帮助。
浏览 1
提问于2022-07-09
得票数 0
1
回答
在字符串列表中查找字符串并在pandas中创建新列
、
我是
Python
新手,正在尝试解决这里
的
性能问题。我需要在
DataFrame
2.col1中查找
DataFrame
1.col1,并使用
DataFrame
1.col2
的
值
在
DataFrame
2.col2中创建一个新列,我正在使用循环来实现这一点,这需要很长时间我正在寻找一种有效
的
方法来做到这一点。此外,如果我得到
多个
匹配
,我应该始终使用从
DataFrame
1找到
的
第一
浏览 4
提问于2017-07-18
得票数 2
1
回答
熊猫数据复制记录拾取错误记录
、
、
、
、
我用
的
是潘达斯,朱庇特笔记本和
Python
。我有一个有4列和10000条记录
的
数据集。当前,当我使用下面的代码来拾取副本时,代码不知怎么地会拾取不正确
的
记录。,但是sub_origin不
匹配
,一个是布莱顿,另一个是布里斯班。同样适用于最后两个记录,日期是
匹配
的
,但原产地并不相同。 从这一点上,我知道df.
duplicated
没有收集到正确
的
记录,或者我没有正确地使用它。数据类型与df.
duplicated
有关系吗?如
浏览 0
提问于2016-06-02
得票数 3
回答已采纳
1
回答
如果熊猫系列中
的
值
被复制,那么重新计算一个布尔
值
吗?
、
、
给出了以下熊猫
DataFrame
: mydf = pd.
DataFrame
([{'Campaign': 'Campaign X', 'Date': '24-09-2014', 'Spend': 1.34: 1}, {'Campaign': 'Campaign Z2', 'Date': '24-08-2014', 'Spend': 4.56, 'Clic
浏览 4
提问于2015-09-03
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
手把手教你做一个“渣”数据师,用Python代替老情人Excel
数据清洗、合并、转化和重构
这十二个用于Python 数据操作的 Pandas 方法你还不知道?
机器学习之计算工具库(四)
每天读一本:利用Python进行数据分析
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券