pandas数据帧单元的numpy数组的元素平均值_作为pandas数据帧管理元素的Numpy数组_numpy数组可以是pandas数据帧中的元素吗？ - 腾讯云开发者社区

、、、

我有一个2x1的pandas数据帧，其中2个单元格包含numpy数组： >>> import numpy as np >>> import pandas as pd >>> a0 = np.array([[1, 2], [2, 2]]) >>> a1 = np.array([[3, 2], [1, 1]]) >>> df = pd.DataFrame([[a0], [a1]]) 我可以计算两个数组的元素平均值，如下所示： >>> np.mean(df[0]) array([[ 2. ,

浏览 7提问于2018-01-24得票数 1

回答已采纳

1回答

使用具有布尔值的另一个数据框过滤数据框值

、、、、

我正在处理多个数据帧。每个数据帧包含尺寸为67行x 215列的数值数据。为了从每个数据框中选择数据，存在另一个具有相同维度并包含布尔值的数据框。我无法检索满足true条件的单元格值。示例代码如下所示。 import pandas as pd import numpy as np #initialize a dataframe df = pd.DataFrame( [[21, 72, 67.1], [23, 78, 69.5], [32, 74, 56.6], [52, 54, 76.2]

浏览 13提问于2021-03-19得票数 1

回答已采纳

1回答

可以使用numpy矩阵来子集pandas数据帧，还是只能使用其他数据帧？

、、

我使用相同形状的布尔矩阵来子集pandas数据帧，以便布尔矩阵中具有相应假单元格的所有值都将显示为NA： import pandas as pd import numpy as np df = pd.DataFrame(np.arange(9).reshape((3,3)), index=['a','b','c']) b = np.ones((3,3), dtype=bool) b[1,1] = False # gives 9x3 array df[b] 有没有办法在不首先将矩阵转换为与df具有相同索引和列的pandas数据帧的情况下完成此操

浏览 3提问于2021-08-06得票数 1

2回答

将数据帧的全部内容传递给Pandas中的函数

、、、

我正在尝试使用Dataframe而不是numpy数组重新编写用于信号处理的大部分分析代码。然而，我很难弄清楚如何将数据帧的整个矩阵作为一个完整的单元传递给函数。例如，如果我正在计算参考信号的共同平均值，我会得到如下结果： avg = signal.mean(axis=1) CAR = signal - avg 我想要做的是将一个pandas数组传递给这个函数，并让它现在返回一个以CAR作为值的dataframe。我喜欢这样做，而不是仅仅返回一个数组，然后将它重新转换回一个数据帧。听起来就像使用df.apply()时，它是按行或按列进行的，而不是放入整个矩阵中。我可以修改CAR的代码来使其工

浏览 1提问于2013-10-30得票数 0

0回答

计算单元格为list的pandas数据帧的平均值

、、

假设我有下面的pandas数据帧 import pandas as pd import numpy as np df= pd.DataFrame(np.nan, columns =["A","B","C"], index =np.arange(5)) df=df.astype(object) for c in list(df): for i in df.index.values: df.at[i, c]=np.arange(5).tolist() 这会产生df，其单元格是numpy数组。 df Out[16]:

浏览 0提问于2018-07-16得票数 4

回答已采纳

1回答

在python中map()函数是如何工作的？

、

我想在pandas数据帧对象上应用numpy函数平均值。由于我想在dataframe对象的逐行元素上应用此函数，因此我应用了map函数。代码如下： df = pd.DataFrame(np.random.rand(5,3),columns = ['Col1','Col2','Col3']) df_averge_row = df.apply(np.average(weights=[[1,1,1],[2,2,2],[3,3,3],[4,4,4],[5,5,5]]),axis=0) 不幸的是，它不起作用。任何建议都会有帮助

浏览 7提问于2019-10-05得票数 0

回答已采纳

2回答

如何用数值数组的列的方式填充n值？

、、

我将pandas数据帧的一部分转换为numpy数组，并希望用列的平均值填充它的值，类似于我在pandas中执行以下操作： df.fillna(df.mean(), inplace = True) 到目前为止，我唯一能做到的方法就是对列进行迭代。还有别的办法吗？谢谢!

浏览 11提问于2021-09-18得票数 2

回答已采纳

4回答

如何在numpy中将数据帧pandas转换为list，而在数组numpy中没有"list“一词

、、、

我已经将pandas中的数据帧转换为numpy中的list，但是我在numpy数组中得到了单词"list“，如图1所示。Figure 1 我希望我能得到numpy格式的列表数据，就像图2中的数组中没有单词" list“一样 Figure 2

浏览 26提问于2020-09-27得票数 0

回答已采纳

1回答

使用字符串填充pandas数据帧

、、

我正在尝试使用numpy数组中的字符串填充pandas数据帧。 <code>A0</code> 假设列'a‘和'b’是浮点数，列'c‘应该是字符串 <code>A1</code> 我试图在for循环中执行此操作，但得到以下错误： <code>A2</code>

浏览 5提问于2020-11-13得票数 0

回答已采纳

2回答

Numpy h堆栈爆炸内存

、、

我是Python新手，我不知道为什么当我使用Numpy hstack将两个pandas数据框架连接在一起时，内存使用量会急剧上升。pandas.concat的性能甚至更差--如果它能完成的话--所以我使用了NumPy。这两个数据帧比较大，但是我有20 gb的空闲RAM (使用11 gb，包括我想要复制的两个数据帧)。数据帧a和b具有形状： a.shape (66377, 30) b.shape (66377, 11100) 当我使用np.hstack((a,b))时，免费的20 up的had已经完全用光了。

浏览 1提问于2014-05-23得票数 3

回答已采纳

1回答

如何在Python中计算数据中特定单元格的平均值？

、、、

我有一个数据帧，每个单元有多个浮动。我需要计算每个单元格的平均值，并将结果放到一个新的数据中。我怎么能在蟒蛇身上做到这一点呢？

浏览 0提问于2022-10-18得票数 2

回答已采纳

1回答

Pandas :计算整个数据帧的平均值或标准差

、、

这就是我的问题，我有一个这样的数据框架： Depr_1 Depr_2 Depr_3 S3 0 5 9 S2 4 11 8 S1 6 11 12 S5 0 4 11 S4 4 8 8 我只想计算整个数据帧的平均值，因为下面的方法不起作用： df.mean() 然后我想到了： df.mean().mean() 但是这个技巧不适用于计算标准差。我最后的尝试是： df.get_values().mean() df.get_values().std() 除了在后一种情况下，它使用numpy中的mean()和std()函数。这对于mean来说不是问

浏览 0提问于2014-08-05得票数 46

回答已采纳

1回答

将多个numpy数组加载到spark rdd中的最快方法？

、、、、

我是Spark新手。在我的应用程序中，我希望从许多numpy数组创建一个RDD。每个numpy数组是(10,000，5,000)。目前，我正在尝试以下操作： rdd_list = [] for np_array in np_arrays: pandas_df = pd.DataFrame(np_array) spark_df = sqlContext.createDataFrame(pandas_df) ##SLOW STEP rdd_list.append(spark_df.rdd) big_rdd = sc.union(rdd_list) 所有的步骤都很快，除了将

浏览 0提问于2016-06-28得票数 0

1回答

numpy.sum在numpy.array和pandas.DataFrame上的行为不同

、、、

简而言之，numpy.sum(a, axis=None)对数组中的所有单元格进行求和，但对数据帧的行进行求和。我认为pandas.DataFrame构建在numpy.array之上，不应该有这种不同的行为吗？什么是幕后的转变？ a1 = numpy.random.random((3,2)) a2 = pandas.DataFrame(a1) numpy.sum(a1) # Sums all cells numpy.sum(a2) # Sums over rows

浏览 0提问于2015-03-01得票数 1

回答已采纳

1回答

如何在熊猫切片上应用lambda函数，并返回与输入数据帧相同的格式？

、

我想应用一个函数对熊猫中每一行的数据切片进行处理，并为每一行返回一个数据片段，其中包含计算出的切片的值和数量。所以，例如 df = pandas.DataFrame(numpy.round(numpy.random.normal(size=(2, 10)),2)) f = lambda x: (x - x.mean()) 我想要的是将lambda函数f从0列应用到5列，从第5列应用到10列。 a = pandas.DataFrame(f(df.T.iloc[0:5,:]) 但这只是第一片..。如何在代码中包含第二个切片，以便我的结果输出帧看起来与输入帧完全一样--只是每个数据点被更改为其值减去

浏览 0提问于2014-11-16得票数 0

回答已采纳

1回答

如何将pandas数据帧中的稀疏矩阵转换为密集矩阵？

、、

我有一个pandas数据帧，其中包含(userId, movieId, rating)格式的行。UserIds和movieIds是任意字符串。我想将它转换为(# of users, # of movies)维的密集矩阵，如果该行存在于第一个单元中，则每个单元为rating，否则为0。我如何在pandas / numpy中做到这一点？

浏览 13提问于2021-11-09得票数 0

3回答

如何从pandas数据帧中提取值并将其放入numpy数组中？

、

我有多个pandas数据帧，我想写一个函数，它将取出数据帧每列中的值，并将它们放入自己的numpy数组中。示例数据帧 In [1]: df = pd.DataFrame([[1, 2], [1, 3], [4, 6]], columns=['A', 'B']) In [2]: df Out[2]: A B 0 1 2 1 1 3 2 4 6 如何从A列和B列的值中生成两个不同的numpy数组

浏览 1提问于2019-04-10得票数 0

2回答

如何将numpy数组存储在Pandas dataframe的列中？

、、、

是否可以将任意numpy数组存储为Pandas的数据帧中单个列的值这些数组都是二维的，我打算使用它们来计算同一数据帧中其他列的值。为了提供一些我想要做的事情的背景：每个数组是某个网络的邻接矩阵，对于每个网络，我要计算它的各种特性(例如密度、集中度、聚类系数等)，它们实际上是同一数据中的其他列。

浏览 4提问于2013-10-24得票数 17

回答已采纳

2回答

如果每个单元格包含一个包含这些值的列表，如何计算矩阵中每个单元格的平均值

、、、、

我有一个大小为20x20 (类型为pandas.core.frame.DataFrame)的数据帧。数据框中的400个单元格中的每个单元格都包含一个带有值的列表。我想分别计算每个列表(单元格)的值的平均值。数据帧如下所示： x y z ... x [1,2,4,3] [1,2,4,3] [1,2,4,3] y [8,2,6,4] [1,2,4,3] [1,2,4,3] z [1,2,4,9] [1,2,4,3] [1,2,4,3] . . . 我想要得到这样的结果： x y z ...

浏览 3提问于2020-02-09得票数 0

1回答

用python索引pandas dataframe中的pandas dataframe

、、、

我在一个数据帧中有一系列的数据帧。顶层数据帧的结构如下： 24hr 48hr 72hr D1 x x x D2 x x x D3 x x x 在每种情况下，x都是使用pandas.read_excel()创建的数据帧每个x数据帧中的一列具有标题‘平均血管长度’，并且在该列中有三个条目(即行、索引)。我想返回的是“平均血管长度”列的平均值。我还对如何返回该列中的特定单元格感兴趣。我知道有一个用于pandas数据帧的.mean方法，但我不知道使用它的索引语法。下面是一个例子 import pandas as

浏览 1提问于2015-03-30得票数 0

2回答

在列组上聚合

、

基于数据帧 import pandas as pd import numpy as np df = pd.DataFrame(np.random.randint(0,100,size=(2, 6)), columns=list('ABCDEF')) print(df) A B C D E F 0 82 63 71 74 71 27 1 90 9 74 35 38 43 如何计算每个不相交的三列组的平均值，以使结果数据框看起来像 meanABC meanDEF 0 72 57.33 1 57.66 38

浏览 6提问于2019-10-16得票数 2

回答已采纳

1回答

大熊猫按匹配条件排列的行数

、、、

假设我有一个Pandas dataframe，如下所示： import pandas as pd import numpy as np df = pd.DataFrame({"time": [100,200,300,400,100,200,300,np.nan], "correct": [1,1,0,1,1,0,0,0]}) 印刷： correct time 0 1 100.0 1 1 200.0 2 0 300.0 3 1 400.0 4

浏览 3提问于2017-03-08得票数 2

回答已采纳

1回答

如何遍历三维数组并计算每个单元格的平均值

、、、、

我想为python中的下列行创建一个循环(我使用py魅力)： mean_diff = np.mean(np.array([diff_list[0].values, diff_list[1].values, diff_list[2].values, diff_list[3].values,...,diff_list[100], axis=0) 这样，我就可以从不同的数组中得到每个单元的平均值(光栅随时间的变化)。我尝试了以下几点： for x in range(100): mean_diff = np.mean(np.array([diff_list[x].values]), axi

浏览 2提问于2018-05-04得票数 0

回答已采纳

1回答

坚持与潘达

、、、、

有关于使用内存映射文件在Joblib中持久化Numpy数组的良好文档。在最近的版本中，Joblib将(显然)以这种方式自动持久化并共享Numpy数组。 Pandas数据帧也会被持久化，还是用户需要手动实现持久性？

浏览 0提问于2018-11-05得票数 2

回答已采纳

2回答

尝试将数组存储到dataframe单元格时出错

、、

我尝试使用df.at将数组存储到数据帧单元格中，如下所示： import numpy as np import pandas as pd arr = np.array([[123, 123], [123, 123]], dtype=int) df = pd.DataFrame(data= [[1, 2], [3, 4]], columns=["A", "B"]) df.at[0, "A"] = arr 但我一直收到以下错误： ValueError: setting an array element with a sequence. 我试着通

浏览 36提问于2021-10-07得票数 0

回答已采纳

2回答

Python Pandas - loc创建fortran有序数值数组

、、

例如： nrow = 10 ncol= 10 a = np.arange(nrow*ncol,dtype=np.int32).reshape(nrow,ncol) a = pd.DataFrame(a) ix_list = np.arange(nrow,dtype=np.int32) print np.isfortran(a.values) # False print np.isfortran(a.loc[ix_list,:].values) # True 为什么.loc要用fortran有序数组来创建pandas数据帧？我能强制它用C有序的numpy数组创建pandas数据帧吗？

浏览 0提问于2017-09-15得票数 3

3回答

如果我使用python pandas，还需要结构化数组吗？

、、

既然pandas提供了数据帧结构，那么numpy中还需要结构化/记录数组吗？我需要对需要这种结构化数组类型框架的现有代码进行一些修改，但从现在开始，我正在考虑使用pandas代替它。我会不会发现我需要一些pandas不提供的结构化/记录数组的功能？

浏览 2提问于2012-08-21得票数 22

回答已采纳

1回答

zip操作与pandas切片操作的比较

、、、、

一个有趣的观察，我觉得我应该澄清。我预计pandas切片操作应该比压缩数据帧的列更快，但在两个操作上运行%timeit时，压缩操作更快…… import pandas as pd, numpy as np s = pd.DataFrame({'Column1':range(50), 'Column2':np.random.randn(50), 'Column3':np.random.randn(50)}) 和在运行中 %timeit s[['Column1','Column3']].loc[30].values

浏览 1提问于2018-10-16得票数 0

1回答

如何在python中从numpy lib的平均方法中删除e科学记数法

、、、、

我是python和numpy库的新手，我正在对我的自定义数据集执行PCA。我计算了来自pandas的数据帧的每一行的平均值，但我得到了以下作为均值数组的结果： [ 7.433148e+46 7.433148e+47 7.433148e+47 7.433148e+46 7.433148e+46 7.433148e+46 7.433148e+46 7.433148e+45 7.433148e+47] 我的代码是： np.set_printoptions(precision=6) np.set_printoptions(

浏览 16提问于2017-01-15得票数 1

回答已采纳

2回答

如何使用pandas或numpy处理(查找均值和标准差)复制数据？

、、

我是Python的新手，最近我一直在尝试使用pandas和NumPy找出数据的均值和标准差。我有代表三个重复的列(对于两个克隆，即C1和C2)，我需要对它们进行平均，然后用标准差作为误差条绘制这些平均值。下面是一个数据帧，第一列中有'time‘和复制(2:4，5:7)。谢谢你 ?

浏览 67提问于2021-02-11得票数 0

2回答

将numpy矩阵转换为一组pandas级数

、、

问:有没有一种快速的方法将2D Numpy矩阵转换为一组Pandas系列？例如，(100 x5) ndarray，到5个系列，每个系列有100行。背景:我需要使用随机生成的不同类型的数据(浮点数、字符串等)创建一个pandas数据帧。目前，对于float，我创建了一个numpy矩阵，对于strings，我创建了一个字符串数组。然后，我将所有这些内容与axis=1结合起来，形成一个数据帧。这不会保留每个单独列的数据类型。为了保留数据类型，我计划使用pandas系列。由于创建多个浮点数系列可能比创建一个浮点数的numpy矩阵慢，我想知道是否有一种方法可以将numpy矩阵转换为一组系列。 Th

浏览 29提问于2021-04-29得票数 0

回答已采纳

1回答

ValueError:使用序列设置数组元素，以便将word2vec模型合并到我的pandas数据帧中

、、、

我得到了"ValueError:使用序列设置数组元素“。当我试图对异构数据运行随机森林分类器时出错--文本数据被馈送到word2vec模型，并且我通过获取文本行中每个单词的word2vec向量来提取一维数组。下面是我使用的数据示例： col-A col-B ..... col-z 100 230 ...... [0.016612869501113892, -0.04279713928699493, .....] 其中，col-z是每行中固定大小为300的numpy数组。下面是计算word2vec向量平均值和创建numpy数组的代码： ` final_d

浏览 0提问于2018-05-11得票数 1

2回答

通过xlwings将数据帧返回到excel

、、、、

我正在尝试使用Python、Xlwing库和Excel创建一个用户定义的函数。目标是使用一个函数，让我们调用ret_data_frames不仅填充A1单元格，而且填充所有需要返回整个数据帧的单元格。如上图所示：我使用的数据框是通过web抓取获得的，而且维度很大，所以我使用一个简单的数据框，如果可行，我会将这个想法替换为我的原始代码 import numpy as np import pandas as pd def get_data_frame(data): dates = pd.date_range(data,periods=6) df = pd.

浏览 0提问于2017-09-13得票数 0

2回答

为熊猫数据中的每一行选择切片/列范围

、、、

以下是问题所在： import numpy import pandas dfl = pandas.DataFrame(numpy.random.randn(30,10)) 现在，我希望将以下单元格放在一个数据框架中：第1行:第3至第6栏(长度=4个单元格)，第2行:第4至第7栏(长度=4个单元格)，第3行:第1至4列(长度=4个单元格)， ect。这些范围中的每一个都是4个单元格宽，但起始/结束是不同的列。逐行开始点在列表[3, 4, 1,...]中，行分终点也是如此。我感兴趣的行列表也是list [1, 2, 3]。最后，dfl有一个我希望保留的日期时间

浏览 4提问于2017-11-27得票数 3

回答已采纳

1回答

如何计算Pandas数据帧上的统计值？

、、、、

我有一个Pandas数据帧，我想使用Describe()方法来计算每一列的统计值，如平均值、标准差和其他值。下面是一个显示框架结构的示例： X Axis (float array) Y Axis (complex array) Val (float) Class 0 [0, 1, 2...] [0, 1+1j, 2+2j,...] 1 'd' 1 [0, 1, 2...] [0, 1+1j, 2+2j,...] 2

浏览 17提问于2019-12-13得票数 0

回答已采纳

3回答

获取pandas数据帧中多个选定列的平均值

、、、

我想要计算数据帧中选定列中所有值的平均值。例如，我有一个包含A、B、C、D和E列的数据框，我想要A、C和E列中所有值的平均值。 import pandas as pd df1 = pd.DataFrame( ( {'A': [1,2,3,4,5], 'B': [10,20,30,40,50], 'C': [11,21,31,41,51], 'D': [12,22,32,42,52],

浏览 14提问于2020-04-25得票数 0

回答已采纳

1回答

使用多个变量对熊猫数据帧进行重采样

、、

我有一个长格式的数据帧，其中包含几个变量的15分钟间隔的数据。如果我应用重采样方法来获得日均值，我会得到给定时间间隔内所有变量的平均值(而不是速度、距离的平均值)。有谁知道如何对数据帧进行重采样并保留两个变量？注意:下面的代码包含一个长格式的示例数据帧，我的真实示例从csv加载数据，并且变量具有不同的时间间隔和频率，因此我不能简单地以宽格式重新采样数据帧。 import pandas as pd import numpy as np dti = pd.date_range('2015-01-01', '2015-12-31', freq='15m

浏览 19提问于2021-11-08得票数 1

1回答

pandas的Numpy等价物替换(字典映射)

、、、

我知道在numpy数组上工作会比pandas更快。我想知道是否有一种等价的(更快的)方法在numpy数组上做pandas.replace。在下面的示例中，我创建了一个数据帧和一个字典。字典包含列的名称及其对应的映射。我想知道有没有什么函数可以让我把一个二进制数组提供给一个numpy数组来进行映射，并产生更快的处理时间？ import pandas as pd import numpy as np # Dataframe d = {'col1': [1, 2, 3], 'col2': [4, 5, 6]} df = pd.DataFrame(data=d)

浏览 2提问于2021-05-24得票数 1

1回答

无法将3d数组转换为数据帧python

我有一个3d列表 l=[ [ [1,"ab",119.0] ] , [ [2,"cd",129.0] ] , [ [ 3,"ef",139.0] ] ] 代码 import pandas as pd , numpy as np l=[ [ [1,"ab",119.0] ] , [ [2,"cd",129.0] ] , [ [ 3,"ef",139.0] ] ] b=np.array(l) print(pd.DataFrame(l)) print(pd.DataFrame(b)) 可以将

浏览 3提问于2018-08-31得票数 2

1回答

将Pandas Dataframe以及numpy数组写入通用Excel文件

、、、、

使用Python3.6和Pandas0.22，我创建了一个Pandas dataframe IRdaily，其中包含各种利率每日变化的时间序列。我可以使用以下命令轻松地将Pandas数据帧写入Excel： writer = pd.ExcelWriter(outFileName) IRdaily.to_excel(writer, 'Daily Changes') 但是，如果我现在计算特征值分解(特征值的向量和特征向量的矩阵都是numpy ndarray)，并尝试将它们写入同一工作表，我会得到一个错误： covD = deltaIRdaily.cov() eigValD, eig

浏览 0提问于2018-06-11得票数 1

1回答

为什么在简单的数学运算中，熊猫比numpy快？

、、、

最近，我观察到熊猫的乘法速度更快。我在下面的示例中向您展示了这一点。在如此简单的操作上，这怎么可能呢？这怎么可能呢？pandas数据帧中的底层数据容器是numpy数组。测量我使用带形状(10k，10k)的数组/数据帧。 import numpy as np import pandas as pd a = np.random.randn(10000, 10000) d = pd.DataFrame(a.copy()) a.shape (10000, 10000) d.shape (10000, 10000) %%timeit d * d 53.2 ms ± 333 µs per loop

浏览 1提问于2020-06-17得票数 2

4回答

如何在python中计算几何平均值并忽略0

、

我有一个由13列特定股票每日股票回报组成的pandas数据框架。我想计算每一列的几何平均值，但一些列中有零，因为这些业务在不同的时间出现在股票市场上。我知道numpy的算术平均值会忽略NaN。有没有办法在计算几何平均值的同时忽略零？示例df： import pandas as pd dictA = {'AAPL': [.02, -.001, .05, .43], 'ABC':[.03, -.02, -.05, 0], 'DEF': [.045, 0, -.10, .63]} df = pd.DataFrame(dictA) AAPL的几何平均

浏览 2提问于2020-04-10得票数 2

1回答

用考虑分组前后的平均值填充包含NaN的单元格

、、、

考虑到有不同的ID，我想用缺失值之前和之后的单元格的平均值来填充pandas数据帧中的缺失值。 maskedid test value 1 A 4 1 B NaN 1 C 5 2 A 5 2 B NaN 2 B 2 预期的DF maskedid test value 1 A 4 1 B 4.5 1 C 5 2 A 5 2

浏览 16提问于2021-08-03得票数 0

回答已采纳

1回答

基于行和列平均值替换缺失值

据我所知，数据帧中缺失的数据(NA)可以被基于行或列的平均值所替代。但是，我在R中试图做的(但不确定是否可能)是根据缺失值所在的单元格所在的行和列来计算缺失单元格的平均值。我在想你有没有什么建议。下面是NA的示例数据： nr <- 50 mm <- t(matrix(sample(0:4, nr * 15, replace = TRUE), nr)) mm[,c(4,7,12,13)]<-NA mm[c(3,5,8,9,10,13),]<-NA

浏览 6提问于2015-11-03得票数 0

回答已采纳

2回答

在R中添加一组类似的数据单元格的优雅方法？

、

我有一个类似类型的1000个数据帧的列表。 dfs<-list() for (i in 1:1000) { dfs[[i]]<-iris[sample(1:length(iris$Sepal.Length),80),-5] } 其中每一个都是80×4数据帧。我想以单元方式添加(或任何其他操作)所有这些数据帧，并将输出作为80x4数据帧，每个单元格包含1000个单元格之和，或者可能是1000个单元格的平均值？

浏览 0提问于2018-07-13得票数 4

回答已采纳

1回答

numpy数组的pandas read_sql_query的等价物？

、、、

我想使用等同于熊猫"read_sql_query“的东西，将数据从数据库加载到numpy数组中，而不是熊猫数据帧中。在pandas中，我使用类似这样的东西： df = pd.read_sql_query(sql="select * from db;", con=con, index_col='index') 现在我需要一个类似如下的函数： A = read_sql_to_np(sql="select * from db;") 其中A是numpy数组。

浏览 15提问于2020-01-28得票数 1

回答已采纳

2回答

将列表的pandas数据帧转换为numpy数组

、、、、

我有以下数据帧： import pandas as pd import numpy as np df = pd.DataFrame([{'a': [1,3,2]},{'a': [7,6,5]},{'a': [9,8,8]}]) df ? df['a'].to_numpy() df['a'].to_numpy() => array([list([1, 3, 2]), list([7, 6, 5]), list([9, 8, 8])], dtype=object) 如何在不编写(3,3)循环的情况下

浏览 23提问于2020-04-03得票数 2

2回答

使用Numpy数组绘制Pandas DF

、、、

我有一个有多列的Pandas df，里面的每个单元格都有不同数量的Numpy数组元素。我想为列中的每个单元格绘制数组的所有元素。我试过了 plt.plot(df['column']) plt.plot(df['column'][0:]) 两者都给出了一个ValueErr:用序列设置数组元素非常重要的是，将这些值绘制到其相应的索引中，因为该索引表示此数据帧中的线性时间。如果有人告诉我如何正确地做这件事，我将非常感激。也许除了matplotlib.pylot之外，还有其他更适合这方面的包？谢谢

浏览 0提问于2020-06-24得票数 0

1回答

存储在dataframe中的计算dask延迟对象

、、、

我正在寻找最好的方法来计算存储在数据帧中的许多dask delayed指令。我不确定是否应该将pandas数据帧转换为包含delayed对象的dask数据帧，或者是否应该对pandas数据帧的所有值调用compute调用。我非常感谢大家的建议，因为我在通过嵌套的for循环传递delayed对象的逻辑上遇到了问题。 import numpy as np import pandas as pd from scipy.stats import hypergeom from dask import delayed, compute steps = 5 sample = [int(x) for x

浏览 10提问于2019-08-10得票数 0

2回答