腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
pandas
-
如何
从
同一
列上
的
数据
帧
中
获得
差异
、
、
除了'value‘列之外,我还有两个相同
的
数据
帧
,需要根据year+name+month列得到'value’
列上
的
两个
数据
帧
的
差值,并将其附加到
数据
集。
浏览 12
提问于2019-03-18
得票数 2
回答已采纳
2
回答
在
pandas
中
合并两个
数据
帧
时
如何
“模糊”匹配字符串
、
我有两个
数据
帧
df1和df2。连接这两个
数据
帧
。但是,正如您注意到
的
,两个
数据
帧
中
的
列Name之间有一些细微
的
差异
。让我们假设他们是
同一
个人。如果我简单地这样做:我只得到了一个只有一行
的
数据
帧
,那就是&
浏览 63
提问于2018-03-06
得票数 5
回答已采纳
1
回答
熊猫切片列和基于条件之间
的
选择子集
、
、
我有如下
数据
:timestamp ["
浏览 3
提问于2020-11-27
得票数 0
回答已采纳
0
回答
无法将excel行与
pandas
dataframe行数匹配
、
、
、
我尝试对文件
中
的
Unicode字符进行编码,并将其传递到
pandas
数据
帧
中
。但是,我在Jupyter notebook中使用df.column.value_counts()
获得
的
唯一行数与
同一
文件
的
excel行数不匹配(在删除重复值之后)。 我
如何
解决这个问题?我加载了一个文本文件(以制表符分隔),并使用encoding = 'ISO-8859-1‘将其转换为
pandas</em
浏览 13
提问于2019-01-21
得票数 0
1
回答
Y轴
的
动态范围(Plotly - Python)
、
、
当我把自动范围条形图显示得不如可能
的
好。然后我决定放置固定
的
范围,但我
的
图形有时会超出y轴。所以我想放入动态范围[0,df‘’yaxis‘+ 500]。它会显示错误:就像是带外。barmode=‘group’,bargroupgap=0.1,)
如何
动态地做呢
浏览 3
提问于2018-11-29
得票数 1
1
回答
当追加多个列时,
如何
解释DataFrame.assign(**kwargs)和dd[x]=y在Dask
中
的
性能
差异
?
、
、
、
在将一些代码
从
Pandas
迁移到Dask时,我发现通过使用多列调用DataFrame.assign()来修改Dask
数据
帧
与使用多个DataFrame.__setitem__() (也称为dataframe[x]=y)调用来修改它之间存在巨大
的
性能
差异
。使用导入对于定义如下
的
Dask
数据
帧
: dd = dask.dataframe.from_
pan
浏览 3
提问于2020-04-16
得票数 0
1
回答
两个独立测试和视图中
的
Dataframe组,类似于spps
、
、
如图所示,我想将维度A
的
变量gm1与周期201802到201803和201804进行比较,然后将周期201803与周期201802和201804进行比较。在第二步
中
,我喜欢添加A、B等统计表示。
浏览 2
提问于2018-10-16
得票数 0
1
回答
Pandas
:计算整个
数据
帧
的
平均值或标准差
、
、
这就是我
的
问题,我有一个这样
的
数据
框架:S3 0 5 9S1 6 11 12S4 4 8 8df.mean()df.mean().mean()df.get_values().mean() df.get_va
浏览 0
提问于2014-08-05
得票数 46
回答已采纳
1
回答
Python -查找两个
数据
帧
之间
的
行
差异
、
、
、
我有两个
数据
帧
,它们
的
列数相同,分别是d1和d2。检查两个
数据
帧
是否具有相同
数据
的
最佳方法是什么?我当前
的
解决方案包括将两个
数据
帧
添加到一起并删除任何匹配
的
行。d1.append(d2) d_dis
浏览 1
提问于2017-08-15
得票数 1
3
回答
在Python /
Pandas
中计算两行之间
的
差异
、
在python
中
,
如何
引用前一行并对其进行计算?01-05 147.05 142.83247 2011-01-07 147.93 143.69data = data.sort(columns='Date')
从
第2行开始,或者在本例
中</
浏览 2
提问于2012-10-29
得票数 67
回答已采纳
4
回答
pandas
中
的
多列分解
、
、
、
pandas
factorize函数将序列
中
的
每个唯一值分配给一个
从
0开始
的
顺序索引,并计算每个序列条目所属
的
索引。我想在多个
列上
实现
pandas
.factorize
的
等价物:df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]}) pd.factorize
浏览 0
提问于2013-05-09
得票数 12
回答已采纳
1
回答
pandas
的
等价物是否适用于pyspark?
、
我真的希望能够在spark
数据
帧
的
整个
列上
运行复杂
的
函数,就像我在
Pandas
中使用apply函数所做
的
那样。例如,在
Pandas
中
,我有一个apply函数,它接受一个混乱
的
域,比如sub-subdomain.subdomain.facebook.co.nz/somequerystring,然后输出facebook.com我怎么在Spark
中
做到这一点? 我看过UDF,但我不清楚
如
浏览 23
提问于2020-04-05
得票数 2
1
回答
pandas
中
的
DataFrame to_csv在某些列
中
引入了字符“。
如何
避免这种情况?
、
、
我有一个
数据
帧
,在
pandas
中使用to_csv后,输出
的
csv文件在某些
列上
有不需要
的
"。
如何
避免这种情况?
浏览 1
提问于2018-10-23
得票数 0
1
回答
如果csv文件是在线下载
的
,
如何
检查该csv文件
中
的
内容是否相同
、
、
、
由于性能
的
原因,在不打开它们
的
情况下,我喜欢快速检查这些csv文件是否被修改或更改。我做了一些测试,了解到即使csv文件没有改变也没有修改,也就是说,没有添加新
的
行,当我下载文件时,文件
的
“修改日期”总是更新
的
。因此,这意味着,检查csv文件
的
"Date modified“属性以告知文件修改并不是一个好主意。任何用python编写
的
建议或示例代码, 另外,如果我想
获得
所有新添加
的
行,我
如何
才能以最快
浏览 0
提问于2019-05-04
得票数 0
2
回答
基于行值
从
dataframe获取值,而不使用列名
、
、
我试图通过知道前两列
中
感兴趣
的
值,
从
pandas
数据
框
中
获取位于第三列
的
值,这将使我找到正确
的
值。我不知道行索引,只知道我需要在前两列
中
查找
的
值。来自前两列
的
值
的
组合是惟一
的
,所以我不希望得到
数据
帧
的
子集,而是只得到一行。我没有列名,所以我想避免使用它们。以
数据
帧
df为例 a
浏览 42
提问于2021-04-07
得票数 0
1
回答
如何
将Sklearn SVM实现应用于使用SPARK ML计算
的
特征( Spark ML
中
缺少多类SVM )
、
、
、
、
我有220 GB
的
数据
。我已经将其作为两列读取到spark dataframe
中
: JournalID和Text。现在,我
的
数据
帧
中
缺少27行。使用NGram类,我在dataframe
中
添加了另外两个列Unigram和Bigram,其中包含文本列
中
的
单字和双字。然后,我使用一元和二元语法
列上
的
pyspark
的
TF和IDF类计算TFIDF,并将其作为另一列添加到da
浏览 1
提问于2018-12-17
得票数 0
1
回答
达斯克分拣
、
、
、
我想在dask中找到
pandas
.dataframe.sort_value函数
的
替代方案。
如何
对Dask
数据
帧
的
多列进行排序?
浏览 1
提问于2018-06-12
得票数 9
回答已采纳
2
回答
熊猫-
从
数据
框架创建
差异
矩阵
、
我试图创建一个矩阵,以显示
Pandas
数据
帧
中行之间
的
差异
。import
pandas
as pd df = pd.DataFrame(data) Country Values1 JP -10.
浏览 10
提问于2017-09-17
得票数 8
回答已采纳
1
回答
合并两个大型
数据
帧
、
、
、
我有两个大
数据
帧
:一个包含3M行,另一个包含2M行第一个
数据
帧
: sacc_id$ id$ creation_date0 001A000000hAUn8IAG/_libs/join.pyx in
浏览 16
提问于2019-01-31
得票数 0
1
回答
在
Pandas
数据
帧
元素上应用条件
、
、
、
、
我正在学习Python,我试图理解apply()方法在
Pandas
数据
帧
中
是
如何
工作
的
。作为练习,我想使用一行代码对
Pandas
dataframe
的
元素应用str.upper()方法,前提是这些元素是字符串。我想知道
如何
才能更深入,并在
Pandas
数据
帧
的
元素上调用函数。这就是我在DataFrame (a Series)
的
一个
列上</e
浏览 5
提问于2017-01-22
得票数 7
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
大数据:从错误的角度出发 如何从数据中获得价值?
pandas系列学习(五):数据连接
这样做能让你的 pandas 循环加快 71803 倍
如何只用一行代码让 Pandas 加速四倍?
如何只用一行代码让Pandas加速四倍?
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券