腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Dataframe
上
的
对数
、
、
、
我有一个像这样
的
数据框,1 0 0 4 50 5 8 6 0我该怎么做呢?
浏览 6
提问于2016-08-26
得票数 3
回答已采纳
1
回答
输出应为带词干
的
数据帧
、
、
、
、
我在试着
对数
据集进行预处理。数据集包含文本数据。我已经从该数据集创建了一个pandas
DataFrame
。我
的
问题是,如何在
DataFrame
上
使用词干分析并获得一个词干
DataFrame
作为输出?
浏览 6
提问于2019-04-03
得票数 0
1
回答
当我们在数据帧
上
运行sql更新时,Apache spark sql谱系是如何演变
的
?
、
、
我正在尝试开发一个后端模块,这将需要我在一个
DataFrame
上
做几个sql更新,由hdfs中
的
拼图格式支持。我感兴趣
的
是多个sql更新如何影响
DataFrame
的
RDD谱系,以及在
DataFrame
上
执行多个频繁
的
sql更新会不会是一个问题,因为根据我
的
理解,在
DataFrame
上
执行一个sql更新就是一种转换有没有等同于在单个沿袭步骤中
对数
据帧进行批量更新<e
浏览 0
提问于2016-09-15
得票数 0
1
回答
我如何在Daru中按索引进行排序?
、
、
在Daru中,我知道通过Daru::
DataFrame
#sort我们可以按照它
的
列
对数
据进行排序,但是我注意到如果我们想要按它
的
索引
对数
据进行排序,那么方法就不能工作。问题 我相信Daru::
DataFrame
#sort是用来按列排序
的
。如何根据索引
对数
据进行排序?
浏览 2
提问于2018-12-28
得票数 0
1
回答
Log- pandas数据帧
的
对数
图
、
我想用熊猫做一个
对数
-
对数
图import pandas as pdy = 10** arange(1,10)*2df1 = pd.
DataFrame
( data=y, index=x )df1.plot(logy=True,logx=True) 怎样才能使x轴成为
对数
?
浏览 0
提问于2014-05-28
得票数 8
回答已采纳
1
回答
将多个数值列替换为这些列
的
日志值Python
、
我正在使用Python语言中
的
pandas
DataFrame
,它有10个变量(4个数字,6个分类)。我想用当前值
的
自然
对数
替换4个数值变量
的
值。下面是我
的
数据示例:logcolumns =要转换为自然
对数
的
列
的
名称Import pandas as pd df = pd.read_csvWeight', 'Price'
浏览 3
提问于2018-12-05
得票数 0
3
回答
如何
对数
据框进行重分类,以便对文本进行索引
、
df = pd.
DataFrame
(data=JLSData)
DataFrame
.head() Employees =
DataFrame
['Employees'] 也就是说,我希望能够按日期和列名
对数
据框进行索引
浏览 21
提问于2020-09-17
得票数 0
回答已采纳
1
回答
版本2.0.13中
的
yhat Rodeo
Dataframe
查看器不显示名称为0
的
列
在Mac OSX
上
,我无法像演示视频中那样
对数
据帧进行排序。例如。import pandas现在转到控制台。您可以看到整个<
浏览 7
提问于2016-08-05
得票数 0
1
回答
df.select()和df.agg()有什么区别?
、
、
、
我有一个数据帧,我想从其中提取最大值、最小值并计算其中
的
记录数。数据帧是:df: org.apache.spark.sql.Dataset[Long] = [id: bigint] 为了获得所需
的
值,但当我尝试df.agg()时,它也给了我相同
的
答案。,如果df.select()和df.agg()提供相同
的
结果,那么它们之间
的
区别是什么?为了获得更好
的
性能,我应该使用哪一个?
浏览 3
提问于2017-06-19
得票数 1
回答已采纳
0
回答
Numpy
对数
适用于boolean Pandas系列,但不适用于
Dataframe
中
的
boolean列
、
、
2.5 True>>> df.dtypes1 float64dtype: object 0 11 0.916291 NaN 我知道取布尔值
的
对数
是没有意义
的
,但是如果我
浏览 1
提问于2017-11-29
得票数 1
回答已采纳
3
回答
Log-log lmplot with seaborn
、
Seaborn
的
函数lmplot能在
对数
-
对数
尺度上作图吗?这是正常比例
的
lmplotimport pandas as pdx = 10**arange(1, 10)df1 = pd.
DataFrame
( data=y, index=x ) df2 = pd.
DataFrame
(data = {'x': x, 'y'
浏览 0
提问于2014-05-28
得票数 44
回答已采纳
2
回答
对
dataframe
中
的
每个自定义组应用唯一
的
主键。
、
DAYS)
dataframe
$B <- as.numeric(as.character(
dataframe
使用这个回收站,我可以看到在一天内某一时间间隔内发生
的
事务
的
哪一部分--无论是上午时间( 0:00至7:00)、日间( 7:00至18:00)还是晚间( 18:00至24:00)。如果是工作日,A列中相应
的
单元格等于零。如果是假日,A栏显示1。B栏
浏览 0
提问于2020-07-27
得票数 1
回答已采纳
1
回答
按星火数据帧所有列分组并计数
、
、
、
我希望使用Spark
对数
据帧
的
每一列执行Group。
Dataframe
将有大约。1000列。println("Printing Dataset :"+ dataset)列名<em
浏览 0
提问于2019-08-12
得票数 1
回答已采纳
1
回答
如何找出熊猫以后每对
DataFrame
.index值之间
的
差异?
、
、
、
为了处理一些数据,我创建了一个
DataFrame
,我希望找到
DataFrame
中每
对数
据之间
的
时间差。对于数组中
的
数据,我可以执行timearray[1:] - timearray[:-1],这导致了一个数组( n-1元素)描述了每
对数
据之间
的
时间差。在熊猫身上,做
DataFrame
.index[1] -
DataFrame
.index[0]给了我我想要
的
结果--我挑选
的
两个指数之间
的</e
浏览 0
提问于2015-02-06
得票数 2
回答已采纳
1
回答
Pandas在修改数据帧后抛出错误
、
我在使用pandas时遇到了一个奇怪
的
错误。 我有一个
对数
据进行装箱和排序
的
函数。这完全可以正常工作。但是,当我尝试
对数
据帧进行子集时,它不再工作,而数据帧看起来是一样
的
。抛出错误
的
代码: idxsort =
dataframe
[header].value_counts().sort_index()ifidxsort.groupby(pd.cut(idxsort.index, bins=b
浏览 25
提问于2019-03-06
得票数 0
2
回答
对给定列表顺序
的
数据帧进行排序Python
、
、
我有一个
dataframe
,其中一行包含人名。现在,我想按名称
对数
据帧进行排序,但不是按字母顺序,而是按给定
的
顺序。因此,例如,我希望在名称行
上
按以下顺序
对数
据帧进行排序: L = ['marc','paul','beck','julia','rest'] 如果我有一个数据帧,其中包含一行名称,我希望marc位于顶部
浏览 16
提问于2019-02-26
得票数 2
1
回答
AWS胶作业-写入单个Parquet文件
、
、
我在带有分区
的
S3桶中收集JSON格式
的
数据。我想将这些JSON文件转换为单个Parquet文件,但是我
的
工作为每个JSON文件创建了一个新
的
Parquet。下面是我在Python中
的
工作脚本:from awsglue.transforms import * from awsglue.utils import getResolvedOptions
浏览 2
提问于2019-09-30
得票数 5
回答已采纳
1
回答
如何在python
DataFrame
中使用for循环将单个值相乘
、
、
、
我想知道如何使用for循环,当我想在python中更改
DataFrame
(panda)中
的
单个值时,2018/02/01 32.085 43.0422018/02/03 30.013 42.016 我想将所有给定
的
价格转换为百分比
对数
回报如何使用for循环来计算所有价
浏览 1
提问于2018-11-08
得票数 1
1
回答
ADF测试结果与arima
的
结果不一致。
、
、
、
、
我尝试在时间序列数据集
上
使用ARIMA模型(STOSTSP-500)。 在将数据输入ARIMA模型之前,我想知道时间序列是否具有平稳性.所以,我选择股票
的
股票是"APA"(Apache公司),我使用adfuller从包statsmodels.tsa.stattools来检验时间序列是否具有平稳性。我还使用了软件包ndiff pmdarima.arima来寻找适合ARIMA模型
的
差分数(据我所知,在ARIMA模型
上
设置这个数字会使时间序列具有平稳性)。并且adfuller
的
p值大于0.0
浏览 5
提问于2021-12-26
得票数 -1
回答已采纳
1
回答
从PySpark创建
的
HiveContext分区数据
、
、
我正在从HiveContext中获取数据并创建
DataFrame
。为了获得性能上
的
好处,我想在应用联接操作之前对DF进行分区。如何在“ID”列上定义数据,然后在“ID”
上
应用联接hiveCtx = HiveContext"select id,name,address from db.table1") df2 = hiveCtx.sql("select id,name,marks fro
浏览 0
提问于2020-09-01
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
DataFrame的数据处理
Python的DataFrame切片大全
python关于dataframe的小练习
为什么需要Pandas的DataFrame类型
PyODPS DataFrame:统一的数据查询语言
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券