Dataframe上的对数

、、、

我有一个像这样的数据框，1 0 0 4 50 5 8 6 0我该怎么做呢？

浏览 6提问于2016-08-26得票数 3

回答已采纳

1回答

输出应为带词干的数据帧

、、、、

我在试着对数据集进行预处理。数据集包含文本数据。我已经从该数据集创建了一个pandas DataFrame。我的问题是，如何在DataFrame上使用词干分析并获得一个词干DataFrame作为输出？

浏览 6提问于2019-04-03得票数 0

1回答

当我们在数据帧上运行sql更新时，Apache spark sql谱系是如何演变的？

、、

我正在尝试开发一个后端模块，这将需要我在一个DataFrame上做几个sql更新，由hdfs中的拼图格式支持。我感兴趣的是多个sql更新如何影响DataFrame的RDD谱系，以及在DataFrame上执行多个频繁的sql更新会不会是一个问题，因为根据我的理解，在DataFrame上执行一个sql更新就是一种转换有没有等同于在单个沿袭步骤中对数据帧进行批量更新<e

浏览 0提问于2016-09-15得票数 0

1回答

我如何在Daru中按索引进行排序？

、、

在Daru中，我知道通过Daru::DataFrame#sort我们可以按照它的列对数据进行排序，但是我注意到如果我们想要按它的索引对数据进行排序，那么方法就不能工作。问题我相信Daru::DataFrame#sort是用来按列排序的。如何根据索引对数据进行排序？

浏览 2提问于2018-12-28得票数 0

1回答

Log- pandas数据帧的对数图

、

我想用熊猫做一个对数-对数图import pandas as pdy = 10** arange(1,10)*2df1 = pd.DataFrame( data=y, index=x )df1.plot(logy=True,logx=True) 怎样才能使x轴成为对数？

浏览 0提问于2014-05-28得票数 8

回答已采纳

1回答

将多个数值列替换为这些列的日志值Python

、

我正在使用Python语言中的pandas DataFrame，它有10个变量(4个数字，6个分类)。我想用当前值的自然对数替换4个数值变量的值。下面是我的数据示例：logcolumns =要转换为自然对数的列的名称Import pandas as pd df = pd.read_csvWeight', 'Price'

浏览 3提问于2018-12-05得票数 0

3回答

如何对数据框进行重分类，以便对文本进行索引

、

df = pd.DataFrame(data=JLSData) DataFrame.head() Employees = DataFrame['Employees'] 也就是说，我希望能够按日期和列名对数据框进行索引

浏览 21提问于2020-09-17得票数 0

回答已采纳

1回答

版本2.0.13中的yhat Rodeo Dataframe查看器不显示名称为0的列

在Mac OSX上，我无法像演示视频中那样对数据帧进行排序。例如。import pandas现在转到控制台。您可以看到整个<

浏览 7提问于2016-08-05得票数 0

1回答

df.select()和df.agg()有什么区别？

、、、

我有一个数据帧，我想从其中提取最大值、最小值并计算其中的记录数。数据帧是：df: org.apache.spark.sql.Dataset[Long] = [id: bigint] 为了获得所需的值，但当我尝试df.agg()时，它也给了我相同的答案。，如果df.select()和df.agg()提供相同的结果，那么它们之间的区别是什么?为了获得更好的性能，我应该使用哪一个？

浏览 3提问于2017-06-19得票数 1

回答已采纳

0回答

Numpy对数适用于boolean Pandas系列，但不适用于Dataframe中的boolean列

、、

2.5 True>>> df.dtypes1 float64dtype: object 0 11 0.916291 NaN 我知道取布尔值的对数是没有意义的，但是如果我

浏览 1提问于2017-11-29得票数 1

回答已采纳

3回答

Log-log lmplot with seaborn

、

Seaborn的函数lmplot能在对数-对数尺度上作图吗？这是正常比例的lmplotimport pandas as pdx = 10**arange(1, 10)df1 = pd.DataFrame( data=y, index=x ) df2 = pd.DataFrame(data = {'x': x, 'y'

浏览 0提问于2014-05-28得票数 44

回答已采纳

2回答

对dataframe中的每个自定义组应用唯一的主键。

、

DAYS)dataframe$B <- as.numeric(as.character(dataframe使用这个回收站，我可以看到在一天内某一时间间隔内发生的事务的哪一部分--无论是上午时间( 0:00至7:00)、日间( 7:00至18:00)还是晚间( 18:00至24:00)。如果是工作日，A列中相应的单元格等于零。如果是假日，A栏显示1。B栏

浏览 0提问于2020-07-27得票数 1

回答已采纳

1回答

按星火数据帧所有列分组并计数

、、、

我希望使用Spark对数据帧的每一列执行Group。Dataframe将有大约。1000列。println("Printing Dataset :"+ dataset)列名<em

浏览 0提问于2019-08-12得票数 1

回答已采纳

1回答

如何找出熊猫以后每对DataFrame.index值之间的差异？

、、、

为了处理一些数据，我创建了一个DataFrame，我希望找到DataFrame中每对数据之间的时间差。对于数组中的数据，我可以执行timearray[1:] - timearray[:-1]，这导致了一个数组( n-1元素)描述了每对数据之间的时间差。在熊猫身上，做DataFrame.index[1] - DataFrame.index[0]给了我我想要的结果--我挑选的两个指数之间的</e

浏览 0提问于2015-02-06得票数 2

回答已采纳

1回答

Pandas在修改数据帧后抛出错误

、

我在使用pandas时遇到了一个奇怪的错误。我有一个对数据进行装箱和排序的函数。这完全可以正常工作。但是，当我尝试对数据帧进行子集时，它不再工作，而数据帧看起来是一样的。抛出错误的代码： idxsort = dataframe[header].value_counts().sort_index()ifidxsort.groupby(pd.cut(idxsort.index, bins=b

浏览 25提问于2019-03-06得票数 0

2回答

对给定列表顺序的数据帧进行排序Python

、、

我有一个dataframe，其中一行包含人名。现在，我想按名称对数据帧进行排序，但不是按字母顺序，而是按给定的顺序。因此，例如，我希望在名称行上按以下顺序对数据帧进行排序： L = ['marc','paul','beck','julia','rest'] 如果我有一个数据帧，其中包含一行名称，我希望marc位于顶部

浏览 16提问于2019-02-26得票数 2

1回答

AWS胶作业-写入单个Parquet文件

、、

我在带有分区的S3桶中收集JSON格式的数据。我想将这些JSON文件转换为单个Parquet文件，但是我的工作为每个JSON文件创建了一个新的Parquet。下面是我在Python中的工作脚本：from awsglue.transforms import * from awsglue.utils import getResolvedOptions

浏览 2提问于2019-09-30得票数 5

回答已采纳

1回答

如何在python DataFrame中使用for循环将单个值相乘

、、、

我想知道如何使用for循环，当我想在python中更改DataFrame (panda)中的单个值时，2018/02/01 32.085 43.0422018/02/03 30.013 42.016 我想将所有给定的价格转换为百分比对数回报如何使用for循环来计算所有价

浏览 1提问于2018-11-08得票数 1

1回答

ADF测试结果与arima的结果不一致。

、、、、

我尝试在时间序列数据集上使用ARIMA模型(STOSTSP-500)。在将数据输入ARIMA模型之前，我想知道时间序列是否具有平稳性.所以，我选择股票的股票是"APA"(Apache公司)，我使用adfuller从包statsmodels.tsa.stattools来检验时间序列是否具有平稳性。我还使用了软件包ndiff pmdarima.arima来寻找适合ARIMA模型的差分数(据我所知，在ARIMA模型上设置这个数字会使时间序列具有平稳性)。并且adfuller的p值大于0.0

浏览 5提问于2021-12-26得票数 -1

回答已采纳

1回答

从PySpark创建的HiveContext分区数据

、、

我正在从HiveContext中获取数据并创建DataFrame。为了获得性能上的好处，我想在应用联接操作之前对DF进行分区。如何在“ID”列上定义数据，然后在“ID”上应用联接hiveCtx = HiveContext"select id,name,address from db.table1") df2 = hiveCtx.sql("select id,name,marks fro

浏览 0提问于2020-09-01得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

输出应为带词干的数据帧

当我们在数据帧上运行sql更新时，Apache spark sql谱系是如何演变的？

我如何在Daru中按索引进行排序？

Log- pandas数据帧的对数图

将多个数值列替换为这些列的日志值Python

如何对数据框进行重分类，以便对文本进行索引

版本2.0.13中的yhat Rodeo Dataframe查看器不显示名称为0的列

df.select()和df.agg()有什么区别？

Numpy对数适用于boolean Pandas系列，但不适用于Dataframe中的boolean列

Log-log lmplot with seaborn

对dataframe中的每个自定义组应用唯一的主键。

按星火数据帧所有列分组并计数

如何找出熊猫以后每对DataFrame.index值之间的差异？

Pandas在修改数据帧后抛出错误

对给定列表顺序的数据帧进行排序Python

AWS胶作业-写入单个Parquet文件

如何在python DataFrame中使用for循环将单个值相乘

ADF测试结果与arima的结果不一致。

从PySpark创建的HiveContext分区数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐