腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(613)
视频
沙龙
1
回答
如
何在
python
pandas
中
做
group
by
和
take
一列
除以
第二
列
数据
帧
唯一
计数
?
、
、
、
我有熊猫
数据
框架与4
列
说' col1 ',' col2 ','col3‘
和
'col4’现在我想按col1
和
col2分组,并想采取聚合如下所说。Count(col3)/(Count(unique col4)) As result_col 我该怎么
做
呢?我正在对熊猫使用MySql。
浏览 0
提问于2017-02-03
得票数 3
回答已采纳
1
回答
如何按子类别的不同
计数
对
数据
帧
/
数据
透视表进行排序?
、
、
、
我尝试通过与第
一列
值相对应的
第二
列
的不同
计数
来对
数据
帧
的第
一列
进行排序。
数据
透视表
中
未排序的
数据
:investor1 Foo A 10 investor2 Bar A公司) distinct count是3,因此investor4
和
匹配值应该在顶部。investor3
和
inves
浏览 10
提问于2019-11-03
得票数 1
回答已采纳
3
回答
在两个数组
中
查找重复的值,
Python
、
、
我有两个数组(A
和
B),每个数组大约有50000个值。每个值代表一个ID。我想创建一个有三
列
的
pandas
数据
帧
,col1:来自数组A的值,col2:来自数组B的值,col3:标签为“
唯一
”或“重复”的字符串。在每个数组
中
,ID:s是
唯一
的。 数组的长度不同。np.array([1, 2, 3, 4, 5])pd.DataFrame({'a':a, 'a
浏览 80
提问于2021-01-28
得票数 2
回答已采纳
1
回答
自联接可将两个日期
列
与两个日期的groupby count
列
合并
、
、
、
、
我有请求日期
和
提货日期
列
。它们是相似的,但不是相同的。我目前使用两个独立的查询
和
pandas
来连接这两个
数据
帧
。我使用SQLAlchemy在Flask
中
运行,因此WHERE
中
的所有内容都将传递给变量。在DB浏览器
中
测试过原始SQL之后,我使用text()方法来运行它。ReqDate >= '2014-01-01'AND PUD
浏览 9
提问于2020-06-20
得票数 0
4
回答
Python
pandas
:如何根据多
列
对
唯一
值进行分组
和
计数
?
、
、
、
datafarme df:1 sam 762 peter 8 我想在'id‘列上分组,并根据(name,number)对计算
唯一
值的数量
浏览 1
提问于2016-02-01
得票数 4
1
回答
CSV文件的第一行是一个字符串的列表,其余行是
Python
中
的元素列表
、
、
我是一个新手,正在尝试使用
Python
3从大量的CSV文件
中
执行一些计算
和
分析一些
数据
。每个CSV文件的
数据
存储在大约30000行
中
,由分号分隔。但在我这样
做
之前,当我读取CSV文件的第一行时,列表中有一个由';‘分隔的字符串,而其余的行都被正确地提取出来了。我已经尝试了拆分文本
和
其他方法,但它们都不会对输出产生任何影响。这就是为什么我需要找出每个CSV文件
中
各个参数的位置。任何想法如何才能做得最好也是值得感谢的。提前谢谢。
浏览 1
提问于2015-06-02
得票数 0
2
回答
基于
Pandas
数据
帧
中
的几个变量计算概率
、
、
、
我对
Python
和
Pandas
还很陌生,所以请耐心听我说……def survivability(total_pass_df, column, value): survivors我确实为这两个组制作了
浏览 2
提问于2017-01-08
得票数 1
3
回答
Pandas
df.describe() -如何将值提取到Dataframe?
、
、
、
我正在尝试一种朴素的贝叶斯方法,在将一些
数据
加载到
Pandas
的
数据
帧
中
之后,describe函数捕获了我想要的
数据
。我想从表的每
一列
中
捕获均值
和
标准差,但不确定如何做到这一点。我可以在R中用summary
做
类似的事情,但不知道如
何在
Python
中
做
。有人能给点建议吗?
浏览 36
提问于2019-01-28
得票数 6
3
回答
如何查找
和
查找
列
引用
中
特定
列
中
的值,并将其值放入
Pandas
中
的新
列
中
、
、
我想在
pandas
中
做
一些类似Vlookup的事情,我有一个两
列
的
数据
框,需要检查
第二
列
值(B)在第
一列
(A)
中
是否有效,如果是,则将行
和
第二
列
值插入到名为C的新
列
中
,下面是示例表: 原始
数据
帧
为:A B b ad b e d 首选
浏览 30
提问于2021-01-12
得票数 0
回答已采纳
1
回答
有条件地在
数据
帧
中
填充值
、
、
我在一个
数据
帧
中有
一列
,我需要用它来填充另
一列
。我在这个
列
中有四个值-- E、H、N
和
P。每个不同的值都用来填充"Size“
列
中
的一个值。对于"N“类型,我想填写"-” 对于"H“
和
"P”类型,我想从相应的
数据
帧
("H
数据
“或"P
数据
”)
中
填写一个值。-
浏览 17
提问于2019-12-15
得票数 1
回答已采纳
2
回答
Pandas
:如何动态使用df.name.unique()方法来查找所有
唯一
的
列
条目?
、
、
这并不是关于如
何在
数据
帧
的
列
中找到所有
唯一
条目的问题,因为我知道如何做到这一点: import
pandas
as pd uni = set(df[key]) 这实际上是关于如何使用
pandas
自己的动态方法/函数
和
这种奇怪的语法来实现它,我不明白为什么有
浏览 70
提问于2019-09-20
得票数 0
回答已采纳
1
回答
如
何在
熊猫
数据
帧
中
查找重复项
、
这里是第0行
和
第2行的副本,因为前3
列
(坐标)是相同的。 我想也许在比较之前对
数据
帧
进行排序会加快代码的速度。但是我不确定如
何在
python
中正确地对它进行排序(我会按第
一列
进行排序。然后,对于第
一列
中
相同的元素,
第二
列
中
的元素
和
第三
列
中
的元素相同。因此,
数据
帧
: 0 1 1 1 1 0 1
浏览 8
提问于2019-06-07
得票数 0
1
回答
DataFrame --如何使用变量进行连接?
、
、
、
、
在
python
上使用Spark
数据
帧
连接两个
数据
帧
时,我遇到了一些麻烦。我有两个
数据
帧
,为了使它们对于每个
数据
帧
都是
唯一
的,我必须更改
列
的名称,所以稍后我可以知道哪
一列
是哪
一列
。我这样
做
是为了重命名列(firstDf
和
secondDf是使用createDataFrame函数创建的火花DataFrames ): oldColumn
浏览 3
提问于2016-09-20
得票数 3
回答已采纳
2
回答
Python
中
的趋势“预测者”?
、
、
、
、
我目前使用的
数据
框(在
pandas
中
)有两
列
:第
一列
是一些数字定量
数据
,
如
重量、某天花费的金额、GPA等,
第二
列
是日期值,即添加相应列1条目的日期。我想知道,在
Python
中
,有没有办法“预测”时间X之后的下一个值?例如,如果我有100个权重条目,跨越2-3个月(不是所有条目都有相同的时间差,所以1个条目可能在第3天、
第二
天5
和
第二
天10),并想
浏览 1
提问于2018-04-08
得票数 1
1
回答
使用
Pandas
创建
唯一列
表
、
、
、
、
我有一个包含超过1000
列
数据
的xlsx文件。我想首先解析
数据
文件
中
的每隔
一列
(可以包含数字
和
字母),然后根据解析的
数据
创建一个
唯一
的列表。我是一个彻头彻尾的新手&我尝试过" for“
和
"do while”循环,但这两个循环对我都不起作用。到目前为止,我有: workbook = pd.read_excel('C:\
浏览 1
提问于2016-09-16
得票数 1
回答已采纳
1
回答
Pandas
多索引
数据
帧
合并问题
、
、
、
、
我想合并两个
数据
帧
,df1
和
df2,它们有多个索引
列
: mi1 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2018')], names=['
中
,第
一列
索引引用变量名,而
第二
列
索引引用年份。一些变量,
如
本例
中
的'id‘,与特定年份无关,因此值为'0’,
浏览 61
提问于2020-12-15
得票数 0
回答已采纳
2
回答
大多数
pandas
-获取列表长度统
计数据
的方式(平均长度、最大长度等)在
pandas
df
列
中
、
我想在
pandas
df专栏
中
获得列表长度的统
计数据
,
如
平均长度、最低长度、最高长度、标准差等。subject1 [3, 4, 6, 7] [2, 2, 7]因此,对于此
数据
帧
,我希望获得trial_num
和
subject
列
的统
计数据
。_libs.hashtable.value_count_object() Ty
浏览 25
提问于2019-10-21
得票数 1
回答已采纳
2
回答
通过将
一列
的所有值与另一
数据
帧
的
列
的所有值进行比较来对
数据
帧
进行切片
、
、
、
我有一个关于切片
数据
帧
的问题。我有两个
数据
帧
:索引为3447,4024的halo_field ...subhalo_field
中
,以便它只包含具有halo_index
列
值的行,该
列
的值也包含在halo_field.index
中
。问题是,这两
列
的长度当然不一样,我不能这样
做
(比较行与行,将
一列
的所有值与另
一列
的所有值进行比较): subhalo_field=subhalo[subha
浏览 1
提问于2018-10-29
得票数 0
1
回答
选择多索引
数据
帧
的最新示例
、
我有一个
和
Getting the last element of a level in a multiindex类似的问题。在前面提到的问题中,多索引
数据
帧
对于每个组都有一个始终相同的起始号。我又有两
列
。
一列
包含整数(在下面的MWE
中
为bool),另
一列
包含datetime索引。与上面的示例类似,我希望为第
一列
最后一行
中
的每个
唯一
值执行select。在我的示例
中
,它指的是具有最近时间戳的值。上面问题
浏览 6
提问于2021-06-25
得票数 1
回答已采纳
1
回答
如何使用
pandas
添加重复列
、
我正在做作业,我遇到了一个问题,我有一个很大的矩阵,第
一列
Y002是一个标称变量,它有3个级别,分别编码为1,2,3。另外两
列
V96
和
V97只是数字。我写了这样的代码然后我用索引来得到每组的平均值
group
2 =
group
["V97"] 现在,我想将这个组均值作
浏览 1
提问于2015-07-18
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券