将numpy中的不同数组添加到数据帧的每一行_Python -消除数值数组或NaN数据帧的每一行中的numpy值_将数据帧中的值添加到不同的数据帧 - 腾讯云开发者社区

python、numpy、dataframe

我是python的新手，我将csv中的大数据加载到了pandas数据帧中。但是，我找不到一种方法来为dataframe的每一行创建一个2d数组，其中新np数组的每一行对应于X范围的值。例如，在我的代码中： import pandas as pd import numpy as np data = pd.read_csv("categorization/dataAll10Overfit.csv",header=None) #print(data) rec = data.iloc[:,0:3968] # outputs i rows x 3969 columns 在数据帧的每一行

浏览 17提问于2017-08-15得票数 2

回答已采纳

3回答

如何从pandas数据帧中提取值并将其放入numpy数组中？

python、pandas

我有多个pandas数据帧，我想写一个函数，它将取出数据帧每列中的值，并将它们放入自己的numpy数组中。示例数据帧 In [1]: df = pd.DataFrame([[1, 2], [1, 3], [4, 6]], columns=['A', 'B']) In [2]: df Out[2]: A B 0 1 2 1 1 3 2 4 6 如何从A列和B列的值中生成两个不同的numpy数组

浏览 1提问于2019-04-10得票数 0

2回答

作为DataFrame列的Scipy稀疏矩阵

python、pandas、dataframe、scipy、sparse-matrix

我正在开发基于pandas DataFrame对象的工具。我希望将scipy稀疏矩阵保留为DataFrame的列，而不是将其按行转换为dtype('O')的列表/数值数组。下面的代码片段不起作用，因为pandas将矩阵视为标量，并建议添加索引。当在矩阵中的行索引上提供pd.RangeIndex时，矩阵将对数据帧中的每一行重复(因为pandas认为它是标量)。 ma = scipy.sparse.rand(10, 100, 0.1, 'csr', dtype=np.float64) df = pd.DataFrame(dict(X=ma)) 这是可行的： df

浏览 12提问于2016-09-12得票数 4

回答已采纳

1回答

矩阵的numpy布尔索引

python、numpy

请对我放松点，因为我还不太熟悉“矮胖”，并且试图把我的头脑集中在一些矮胖的概念上，而我有一个问题：问题我有一个名为boxes.shape = (2, 200, 4)的numpy数组名为boxes。有2个帧，每个框有200个框，每个框有4个坐标点。我有一个名为to_keep和to_keep.shape = (2, 200)的布尔数组。对于每一帧，都有200 d数组指示是否保留该框。我想过滤掉boxes，只保留to_keep为真的部分。我得到的形状应该是filtered_boxes.shape = (2, N, 4) 问题是，对于第一帧，25框可能是有效的。但是对于第二帧，100框可以

浏览 1提问于2018-08-23得票数 0

1回答

将向量添加到numpy中的矩阵行

vector、matrix、numpy

在numpy中，有没有一种快速的方法将向量添加到矩阵的每一行或每一列。最近，我一直在将向量平铺到矩阵的大小，这可能会占用大量内存。例如 mat=np.arange(15) mat.shape=(5,3) vec=np.ones(3) mat+=np.tile(vec, (5,1)) 我能想到的另一种方法是使用python循环，但循环速度很慢： for i in xrange(len(mat)): mat[i,:]+=vec 在numpy中有没有一种快速的方法来做到这一点，而不用求助于C扩展？如果能够虚拟平铺一个矢量，就像广播的一个更

浏览 0提问于2012-08-15得票数 23

回答已采纳

1回答

将数据帧行转换为numpy数组

python、dataframe

? 我有一个数据帧，要使用的列是"sepal_length“和"sepal_width”。我想把每一行都变成一个数据点，就像point1= [5.1 3.5]和point2 = [4.9 3]等等。.to_numpy()只是将整个2列转换成大型的numpy数组，所以它对我不起作用。我怎么才能锻炼呢？

浏览 8提问于2020-10-30得票数 0

1回答

将多个numpy数组加载到spark rdd中的最快方法？

numpy、pandas、apache-spark、pyspark、spark-dataframe

我是Spark新手。在我的应用程序中，我希望从许多numpy数组创建一个RDD。每个numpy数组是(10,000，5,000)。目前，我正在尝试以下操作： rdd_list = [] for np_array in np_arrays: pandas_df = pd.DataFrame(np_array) spark_df = sqlContext.createDataFrame(pandas_df) ##SLOW STEP rdd_list.append(spark_df.rdd) big_rdd = sc.union(rdd_list) 所有的步骤都很快，除了将

浏览 0提问于2016-06-28得票数 0

1回答

使用PyAV直接将视频读入Numpy (不迭代)

python、python-3.x、numpy、video-processing、pyav

可以用PyAV直接将视频读入3D Numpy吗？目前，我正在遍历每一帧： i = 0 container = av.open('myvideo.avi') for frame in container.decode(video=0): if i == 0: V = np.array(frame.to_ndarray(format='gray')) else: V = np.dstack((V, np.array(frame.to_ndarray(format='gray')))) i += 1 第一帧定义了一个2D Num

浏览 0提问于2020-01-29得票数 5

回答已采纳

2回答

hdf到ndarray的快速方式

python、numpy、hdf5、h5py

我正在寻找一种快速的方法来将我的hdf文件集合设置为一个numpy数组，其中每一行都是图像的扁平版本。我的确切意思是：我的hdf文件存储，除了其他信息，每帧图像。每个文件包含51个帧和512x424图像。现在我有了300+ hdf文件，我希望图像像素被存储为每帧一个向量，其中所有图像的所有帧都存储在一个numpy ndarray中。以下图片应有助于理解：到目前为止，我得到的是一个非常缓慢的方法，实际上我不知道如何使它更快。问题是，据我所想，我的最后一个数组调用得太频繁了。由于我观察到第一个文件被加载到数组中的速度非常快，但是速度下降得很快。(通过打印当前hdf文件的数量来观察)

浏览 3提问于2017-03-29得票数 0

回答已采纳

1回答

Python，保存数据和变量的方法

python、numpy

我试图使用python包将一些数值计算数据保存到一个文件中。我在io和os中看到了open()，它们主要处理测试文件。当我试图使用scipy和numpy文件运行矩阵和向量时，我在googled上搜索了一些结果，结果回来了很多次。在matlab中，主要有两种不同类型的文件，一种是处理大于2G的变量，另一种是非常简单的读取和保存文件的方法，一种是简单地读取文件，另一种是直接在文件中搜索而不打开它(节省内存)。我的问题是：有没有类似的文件类型和方法来处理python中的文件(用于向量和矩阵)？在诸如numpy.save、numpy.savetxt等命令(对于numpy矩阵和单个值)中

浏览 1提问于2018-03-17得票数 0

回答已采纳

1回答

如何将Python中更大的矩阵中的每50个值平均

python、python-3.x、numpy、image-processing、matrix

我有7000张图片的数组，这些图像大小为224x224x3。因此，整个矩阵形状是(7000, 224, 224, 3)。我想要做的是选择每50幅图像，并计算它们的平均获取50帧中的1帧，所以我总共有一个大小为(140, 224, 224, 3)的数组。一个最小的可重复的例子： import numpy as np array = np.random.randint(255, size=(7000, 224, 224, 3)) mean_frame = np.mean(([frame for frame in array]), axis=0) 这是我能得到的最接近的图像，它会给我一个(224,

浏览 4提问于2022-04-25得票数 0

回答已采纳

1回答

如何将行从pandas数据框加载到numpy数组？

python、arrays、pandas、numpy

问题是如何将行从pandas数据帧加载到numpy数组中，以便逐行处理？虽然在类似的问题上有许多问题，但这个问题是独一无二的，因为它需要逐行处理，我已经通过for循环促进了这一过程。for循环打算将dataframe中的每一行作为numpy数组，并将其与另一个具有任意浮点值的numpy数组相乘。最小函数定义如下。 def function(): #Load Data data = pd.read_csv('data.csv') #Forward for row in data: variable_matrix = np.arra

浏览 23提问于2021-09-08得票数 0

2回答

我的Numpy阵列应该是什么尺寸？欧比迹

python、arrays、numpy、keras、obspy

我目前有175 x事件的地震数据，每个事件有3条痕迹(痕迹是非常规的地震数据阵列)。对于175个样本中的每个样本，我都有地震数据是否是地震的分类标签。我希望将数据格式化为numpy数组进行建模。我尝试过将每个列都是不同的跟踪放入numpy数组的数据帧中。所以列就是“追踪一”，“追踪二”，“追踪三”。这是行不通的。我尝试过很多不同的方法来安排数据与角点一起使用。我现在希望为数据创建一个numpy矩阵，然后用于建模。我曾想过这个形状可能是(175,3,7501)作为(#number of events, #number of traces,#number of samples in trace)，

浏览 14提问于2022-08-03得票数 -1

1回答

如何在Opencv中表示捕获的每个视频帧？

python、opencv、numpy、image-processing、video-processing

我正在探索Opencv VideoCapture.I。我能够捕获和显示视频。我尝试在console.Then中打印每一帧。我得到一个很长的数字array.What由该数组中的每个数字表示?它是该帧中每个像素的RGB值吗？ import numpy as np import cv2 cap = cv2.VideoCapture(0) cap.set(3,640) cap.set(4,480) while(True): # Capture frame-by-frame ret, frame = cap.read() print len(frame) print fr

浏览 4提问于2016-09-21得票数 1

1回答

将每一行文本文件作为numpy数组加载，而不进行循环。

python、python-3.x、numpy、numpy-ndarray

我有包含频繁规则挖掘数据的数据集，其中每一行都有不同数量的项，如 9 10 5 8 9 10 5 12 15 7 3 5 是否有办法立即读取具有上述内容的文件，并将其转换为numpy array of arrays arrays np.array(np.array([ array([array([ 9, 10, 5]), array([ 8, 9, 10, 5, 12, 15]), array([7, 3, 5])], dtype=object) 我遇到过numpy.loadtxt函数，但它并不能以我想要的方式满足不同数量的列。对于不同的列数，loadtxt要求提及用于读取

浏览 3提问于2020-04-15得票数 1

回答已采纳

1回答

python中的列表、矩阵和数据帧

python、numpy、matrix

我在python中工作，在理解列表、数值数组、矩阵和熊猫数据帧之间的关系时遇到了问题。我知道以下几点，从df转到矩阵就足以调用as_matrix()。我现在正在尝试从一个双列表中创建一个numpy矩阵。我的列表有3个891个元素的列表(但它可以是任何数字)。假设列表是tmp，我有len(tmp) = 3和len(tmp[0]) = 891。然后我做了tt = numpy.matrix(tmp)。如果我现在这样做了： print tt.shape 这是(1,3)。现在，我也试过 print tt[0].shape 和 print tt[0][0].shape 和 print tt[0][0

浏览 0提问于2016-04-02得票数 0

1回答

Numpy:三维到二维的沿一个轴的平序的最大形状

arrays、numpy、reshape

我想从磁盘中读取非常大的二进制文件(GB+)，并进行进一步处理。数据的结构如下:F帧，每帧由长度N的B块组成，而N是一个数。我用np.fromfile读取数据，得到一个一维np.array。我想要重塑数据的方式，他们的形状(F*N，B)，以便我可以很容易地操作块。我有一种方法可以实现我想做的事情--但是它使用了for-循环，并构建了一个新的数组(所以效率不高)： import numpy as np F,B,N= 2,2,2 Data3D = np.arange(F*B*N).reshape(F,B,N) Data2D = np.zeros(F*B*N).reshape(F*N,B) for

浏览 0提问于2014-05-04得票数 0

回答已采纳

2回答

使用Numpy数组创建显示图(Seaborn)

python、numpy、plot、seaborn

我正在尝试创建一个散点图，其中我看到了三个不同变量的直方图(每个变量在numpy数组的不同列中)。我希望每一列在facet网格中显示为不同的子图，但我似乎找不到一种方法来做到这一点，而不是将我的数据转换为数据帧。我一直在努力寻找答案，但几乎所有在线多点图显示的示例都是针对结构化为数据框架的数据。非常感谢!

浏览 63提问于2021-04-02得票数 0

回答已采纳

1回答

使用sp()包计算两组坐标之间的最短距离

r、apply、geospatial、distance、sp

我有两组坐标(基坐标和目标坐标)作为两个数据帧。 base.df <- data.frame(cbind(LONG = c(-73.94006,-73.95616,-73.86548,-73.99118,-73.99801, -73.96208,-73.95544,-74.09251,-73.94317,-73.98913), LAT = c(0.78963,40.65378,40.83767,40.75533,40.74759,

浏览 3提问于2018-03-21得票数 0

1回答

通过命令行读取CSV为Numpy 2d矩阵的错误

python、csv、numpy、genfromtxt

我试图使用csv.reader()函数将CSV文件中的数据读入numpy矩阵，并使用以下代码将其存储到Numpy 2d矩阵中： import sys import csv filename1 = sys.argv[0] reader = csv.reader(open(filename1, "rb"), delimiter=",") x = list(reader) result = numpy.array(x).astype('int') 但是，当我运行这段代码时，我会得到以下错误： Traceback (most recent call la

浏览 1提问于2017-08-24得票数 0

2回答

如何将帧数组转换为帧对数组？

python、arrays、numpy

我有一个numpy数组，比如400x80。我想把它变成一个400x160的数组，这样每一项都是这样形成的： ? 在这里，80的每一帧被复制到下一帧的开始处，并且第一帧最多80个零。那么如何在numpy中做这样的事情呢？有没有一种机制可以推广到三个或更多的框架？

浏览 23提问于2021-07-17得票数 1

回答已采纳

1回答

如何在不保存图像的情况下将Numpy数组图像转换为JPEG？

python、numpy、opencv、opencv-python、face-api

我正在使用Microsoft Azure的Face API来检测视频中一个人的情绪。我有一个Python程序可以正确处理本地图像，现在我正在尝试拍摄本地视频并将每一帧发送到API，并存储每一次分析的结果。发送到Azure的Face API的数据需要是以字节形式读取的PNG/JPG文件： image_data=open(image_source, "rb").read() OpenCV似乎是使用Python逐帧浏览视频的标准，但帧是Numpy数组类型的。您可以将视频的每一帧以JPG格式保存到磁盘上，如下所示： import cv2 # OpenCV vidcap = cv2.

浏览 19提问于2021-02-04得票数 1

回答已采纳

3回答

将Pandas DataFrame转换为一个块数组

python、pandas、numpy-ndarray

我有像这样的熊猫数据帧。但是我想让'KDB‘列像这样(没有索引)，有人能帮我吗？ [9. 3. 3. 2. .....] 我尝试使用pd.DataFrame.to_numpy()，但得到的结果如下所示。 [[ 9] [ 3] [ 3] [ 2] ...]

浏览 0提问于2020-02-25得票数 0

2回答

在pandas dataframe列中使用字典键

python、pandas

我编写了以下代码，在其中创建了pandas数据帧字典： import pandas as pd import numpy as np classification = pd.read_csv('classification.csv') thresholdRange = np.arange(0, 70, 0.5).tolist() classificationDict = {} for t in thresholdRange: classificationDict[t] = classification for k, v in classificationDic

浏览 1提问于2017-03-19得票数 0

1回答

我有一个包含多个数组的npy文件，我想将其添加到dataframe - python中的列中

python、pandas、numpy、dataframe、merge

我的npy文件包含120951个数组，加载方式如下： import numpy as np arm = np.load('full_numpy_bitmap_arm.npy') 我还有一个数据帧df，它有120951行和6列。我想将"arm“变量中的每个数组附加到数据帧中的每一行，作为数据帧末尾的一个新列。例如，arm在第一行最后一列，arm1在第二行最后一列，等等。我不确定连接函数在这里是否有效，因为arm不是一个数据帧。我想知道是否有其他方法可以做到这一点？谢谢

浏览 1提问于2020-11-25得票数 1

1回答

更新每个帧上的整个VBO是绘制许多变化的唯一三角形的最有效的方法吗？

opengl-es、webgl

对的回答建议我使用一个顶点缓冲区对象，并将我的位置数据与我的颜色数据合并到一个数组中，在这个简单的测试用例中我已经这样做了：每个帧的伪代码： function drawFrame() { // clear global vertex[] array containing both position and color // recreate it with new triangles and colors (determined elsewhere) drawShapes(); // put the vertex array into the VBO us

浏览 0提问于2014-07-07得票数 4

回答已采纳

3回答

将列表追加到numpy数组

python、arrays、numpy、csv

我有一个(可能)非常愚蠢的问题。我正在尝试使用numpy将csv文件中的数据组成一个数组。我希望csv文件中的每一行和每一列都是numpy数组中唯一的行和列。为此，我使用CSV模块读取数据，并尝试使用for循环将其附加到numpy数组中。我不能让它工作。( csv文件使用字符串) import csv import numpy as np f = open('data.csv') csv_file = csv.reader(f) arr = np.zeros((121, 30)) rotations = 0 x = 0 for row in csv_file:

浏览 33提问于2020-11-09得票数 0

回答已采纳

1回答

用于实例呈现的收集实体的数据结构

opengl、data-structure、instancing

我的游戏，一个城市建设者，有许多简单的实体，通过glDrawArraysInstanced呈现。一个大城市有超过60万个实体，但这些实体中的大多数都是几百个网格中的一个。每帧，我需要一种方法收集所有这些实体，以便每个实体具有相同的网格，纹理和阴影传递可以通过一次绘制调用。由于我的游戏线程是独立于我的渲染线程，我目前使用一个数据结构，我称之为绘图缓冲区，收集一个计划，什么顺序画东西。这种数据结构已经成为一个真正的问题。它本质上是指向动态数组的三维指针链，第一个维度是阴影传递，第二个网格和第三个纹理。每一帧，游戏都要遍历所有实体(没有任何特定的顺序)，过滤掉那些不在视图中的实体，并将网格的数据插

浏览 0提问于2020-07-08得票数 4

2回答

如何在不先转换为numpy的情况下将一个数据帧划分为另一个数据帧？

python、pandas、numpy

我有一个包含两列x和y和几百行的dataframe。我有另一个只有一行和两列的数据帧，x和y。我想将大数据帧的x列除以小数据帧的x中的值，并将y列除以y列。如果我将一个数据帧除以另一个数据帧，我将得到所有的NaNs。为了让分区正常工作，我必须将小数据帧转换为numpy。为什么我不能将一个数据帧除以另一个数据帧？我遗漏了什么？下面我有一个玩具示例。 import numpy as np import pandas as pd df = pd.DataFrame() r = int(10) df['x'] = np.arange(0,r) df['y'] =

浏览 4提问于2020-02-11得票数 1

1回答

这个矩阵运算的正式名称(矩阵列乘以列向量)？

python、matrix、multiplication、nomenclature

我已经编写了以下Python/Pandas代码，将M行x N列数据帧(A)的每一列乘以M x 1数据帧(b)，得到M x N数据帧C： def multiply_columns(A, b): C = pd.DataFrame(A.values * b.values, columns=A.columns, index=b.index) return C 换句话说，它将矩阵的每一列乘以长度相等的列向量。代码运行良好，但是我想不起这个操作的正式名称了。有什么想法？

浏览 12提问于2015-03-17得票数 1

3回答

在python中存储和操作时间戳数组的最有效方法

python、datetime

我正在用python设计一个延迟敏感的应用程序，在其中我将有几个时间戳数组。我正在尝试计算事件在过去1、5、25、50和100秒内发生的次数，因此总共有5个数组。我计划在事件发生时将事件的时间附加到这些数组中。然后在一个单独的线程中，我将删除早于过去1、5、25、50或100秒的值。我预计每100秒发生的次数通常少于1000次，但理论上的最大值是每100秒10,000次。我计划使用一个基本的datetime对象数组，但我感兴趣的是了解哪种数据结构更快。一开始，我在考虑一个熊猫数据帧，但事实证明这太慢了。我知道numpy数组并改用time.time()，但我想还有其他更有效的方法。我很想听听p

浏览 1提问于2021-10-15得票数 0

2回答

检查pandas数据帧中是否没有

python、pandas、numpy、nan

我想找出在数据帧中找不到的地方。 pd.DataFrame([None,np.nan]).isnull() OUT: 0 0 True 1 True isnull()查找numpy Nan和None值。我只想要None值，而不是numpy Nan。有没有一种更简单的方法来做到这一点，而不是遍历数据帧？编辑:读完评论后，我意识到在我的数据帧中，我的作品中也包含了字符串，所以None没有被强制为numpy Nan。因此，Pisdom给出的答案是有效的。

浏览 7提问于2017-07-24得票数 8

回答已采纳

1回答

如何将列表/数组中的列填充到只有列名的空Pandas数据帧中

python、pandas、dataframe

我有一个包含多个列名的数据帧。当我获得每一列的数据时，我必须创建行。我没有在一个地方提供所有的行数据。当我获得特定行中某列的数据时，我将填充它在下面的示例中，我创建了一个空的dataframe，并且我正在尝试用一组值填充特定的列。这不管用。 import pandas as pd import numpy as np col_names = ['ampere', 'freq', 'count'] dataf = pd.DataFrame(columns = col_names) freq = np.arange(0.6,2.6,0.1).t

浏览 16提问于2020-04-17得票数 0

1回答

从NumPy 2D数组中为线条图指定标签名

python、numpy、matplotlib

我想用2D NumPy数组来绘制每个列的line图： import numpy as np import matplotlib.pyplot as plt arr = np.random.random((10, 5)) ax.plot(arr) 但是，我不知道如何为这五列中的每一列分配label名称。假设列名是：a、b、c、d和e。

浏览 5提问于2016-05-14得票数 1

回答已采纳

1回答

选择与numpy nd数组相等的行。

python、pandas、numpy、dataframe

我有一个熊猫的Dataframe "pat_data"，它看起来如下( f1 to f5列包含二进制数字) Stay_id | f1 | f2 | f3 | f4 | f5 ---------------------------------- 1011 | 1 | 0 | 1 | 1 | 0 1011 | 0 | 1 | 0 | 0 | 1 . . . 1011 | 0 | 1 | 1 | 1 | 1 以及保存为numpy nd-数组的一个子集，如下所示： [[0 1 1 1 1] [1 0 1 1 0] [0 0 0 0 0] ...

浏览 4提问于2020-02-20得票数 0

2回答

从字典写入numpy数组

python、arrays、dictionary、numpy

我有一个文件头值(时间、帧数、年、月等)的字典，我想把它写到numpy数组中。我目前拥有的代码如下： arr=np.array([(k,)+v for k,v in fileheader.iteritems()],dtype=["a3,a,i4,i4,i4,i4,f8,i4,i4,i4,i4,i4,i4,a10,a26,a33,a235,i4,i4,i4,i4,i4,i4"]) 但我得到一个错误，“只能将tuple (而不是"int")连接到tuple。基本上，最终结果需要是存储整个文件头信息( 512字节)和每帧数据(头和数据，每帧49408字节)的

浏览 0提问于2012-06-01得票数 3

回答已采纳

1回答

使用numpy.save/numpy.load将浮点数组的数值数组保存到.npy文件中时，是否有任何原因会导致数组的顺序发生变化？

python、numpy

我目前有一个数据，其中每一行都有一个文本通道和一个numpy浮动数组。据我所知，将这两种数据类型保存为一种数据格式是不有效的(如果我错了，请纠正我)。因此，我将使用另一列int单独保存它们，当我想要再次连接这两个数据集时，将使用该列将它们映射到一起。我很难弄清楚如何在float数组后面追加一列it(如果有人有解决方案，我很想听听)，然后保存numpy数组。但是后来我意识到，如果我可以确认numpy.save和numpy.load永远不会改变数组的顺序，那么我可以只保存numpy.save中的浮点数组，而不需要额外的int列。这样，我就可以将加载的numpy浮点数组原样附加到panda

浏览 49提问于2019-05-14得票数 1

回答已采纳

1回答

将视频帧作为字节数据读取

python、opencv、video、computer-vision、video-streaming

因此，我需要逐帧读取视频源(文件/流)，然后通过互联网实时发送每一帧。问题是，当我使用OpenCV VideCapture时，它返回的numpy数组很难处理(一个帧可能需要20Mb，但当我将其保存为png时，它大约是300kb)。(如果使用一些标志VideCapture可以返回字节而不是numpy数组，那就太酷了) 问题是，如何将视频源读取为原始字节，这样在使用OpenCV的情况下，我就不需要将numpy转换为字节。

浏览 8提问于2021-05-27得票数 1

3回答

如何向NumPy数组中添加多个额外列

python、arrays、numpy、data-science

假设我有两个NumPy数组，a和b a = np.array([ [1, 2, 3], [2, 3, 4] ]) b = np.array([8,9]) 我想将相同的数组b附加到每一行(即。(添加多个列)以获得数组，c b = np.array([ [1, 2, 3, 8, 9], [2, 3, 4, 8, 9] ]) 如何在NumPy中轻松高效地完成这一任务？我特别关注它在大数据集( a比b大得多)时的行为，有没有办法创建许多副本(即。( a.shape[0]) of b 与相关，但具有多个值。

浏览 0提问于2018-09-01得票数 2

回答已采纳

1回答

如何在Python/Pandas中将循环的垂直列转换为行，然后将它们堆叠在一起？

python-2.7、pandas、dataframe、transpose、data-manipulation

我首先垂直生成一些数据，但希望将它们转置为行数据，然后将它们堆叠到一个类似Pandas数据帧的数组中。如何获得包含4列('fr'，'en'，'ir'，'ab')和3行的熊猫数据帧的最终结果？ # coding=utf-8 import pandas as pd from pandas import DataFrame, Series import numpy as np import nltk import re import random from random import randint import csv import

浏览 1提问于2015-10-20得票数 2

3回答

我需要导入Numpy才能使用Pandas吗？

python、pandas、numpy、flake8、linter

我用熊猫来管理一些数据帧。在我看过的每一本教程中，它们都是在和熊猫一起工作的时候进口的，所以我把它们都导入了。我最近还安装了flake8 linter，它给了我以下消息： numpy as np imported but not used 这两个包都需要一起运行吗?还是我可以删除Numpy？

浏览 3提问于2021-07-21得票数 1

回答已采纳

2回答

Python:基于数组的方程式

python

我有一个500行乘4列的数据帧。我需要找到正确的python代码，该代码将当前行除以下面的行，然后将该值乘以每列中每个值的最后一行中的值。。

浏览 0提问于2020-04-09得票数 1

1回答

将numpy中的不同数组添加到数据帧的每一行

apache-spark、pyspark、apache-spark-sql、pyspark-sql

我有一个SparkSQL数据帧和2Dnumpy矩阵。它们具有相同的行数。我打算将numpy矩阵中的每个不同数组作为新列添加到现有的PySpark数据帧中。这样，添加到每一行的列表是不同的。例如，PySpark数据帧如下所示 | Id | Name | | ------ | ------ | | 1 | Bob | | 2 | Alice | | 3 | Mike | numpy矩阵是这样的 [[2, 3, 5] [5, 2, 6] [1, 4, 7]] 产生的预期数据帧应该如下所示 | Id | Name | custo

浏览 16提问于2019-10-05得票数 0

1回答

在三维numpy阵列中堆叠数据

python-3.x、pandas、dataframe、numpy、numpy-ndarray

我有几只熊猫的数据，我想把它们堆起来，用numpy作为一个三维的数字数组。我可以使用以下代码手动完成这项工作： arr = np.array([df1.values, df2.values], dtype="object") 但是，由于我有很多数据格式，所以我既不能为所有的数据文件写这行，也不能自动完成它。我试着使用append函数(np.append(df1.values, df2['1002'].values))，但它使数据变得扁平，忽略了它们的结构。我想要的是一个三维的numpy数组，其中第一个维度是数据的数量(我有)，第二个是每个数据帧中的行数，第三个

浏览 4提问于2022-01-22得票数 -1

2回答

即使在所有数据频繁更改的情况下，VBO是否也能提高性能

opengl

我正在做一个基于2D转弯的32x32瓦片(每帧400-500瓦片)的RTS游戏。我可以使用VBO来实现这一点，但我可能必须更改几乎所有的VBO数据每帧，因为背景是一个滚动的背景，可见的瓦片将改变每次地图滚动。在这里，使用VBO而不是客户端顶点数组仍然会带来性能优势吗？另外，如果使用VBO，哪种数据格式是最有效的(浮点型、int16或...)？

浏览 1提问于2011-07-21得票数 1

回答已采纳

4回答

如何在numpy中将数据帧pandas转换为list，而在数组numpy中没有"list“一词

python、arrays、pandas、numpy

我已经将pandas中的数据帧转换为numpy中的list，但是我在numpy数组中得到了单词"list“，如图1所示。Figure 1 我希望我能得到numpy格式的列表数据，就像图2中的数组中没有单词" list“一样 Figure 2

浏览 26提问于2020-09-27得票数 0

回答已采纳

2回答

如何将Dataframe的每一列保存到CSV文件中的单独列？

python、csv、dataframe

当我保存我的数据帧到csv文件时，它被组合在一列中，我希望数据框的每一列在CSV文件中出现在单独的列中，这是代码 df.to_csv(r'myData.csv',sep=',',encoding="utf-8",columns=['id','created_at','text']) 但它保存在CSV文件的一列中，以逗号分隔 0,2019-09-28 08:58:13,"The TRUTH about Carbon Dioxide" 我希望每个值都在单独的列A，B，C中有没有办法做

浏览 50提问于2019-09-28得票数 1

1回答

数据帧中等号行组的线性回归

我有一个由2列组成的数据框架:y和x。数据帧的尺寸是10000行和2列。这10000行指的是500个样本，每个样本有20y和20x。如何对每个样本(每组20行)进行线性回归，以便将估计系数存储在单独的500行数据结构中？我知道我可以执行summary(lm(y ~ x))$coefficients[2, 1]来获得数据帧中每一行的估计系数。然而，我的目标是估计每个样本的系数，而不是每一行。

浏览 2提问于2015-04-19得票数 0

回答已采纳

2回答

对具有多个y1:y2，x1:x2的numpy数组的多帧进行切片

python、arrays、numpy、slice

我有一个多帧(multiple_frames)的numpy数组，我想用不同的y1，y2，x1，x2切片每个帧的高度和宽度，在每个帧中绘制一个"1“的正方形。(slice_yyxx)是一个numpy数组，每帧包含一个y1、y2、x1、x2数组。 slice_yyxx = np.array(slice_yyxx).astype(int) nbr_frame = slice_yyxx.shape[0] multiple_frames = np.zeros(shape=(nbr_frame, target_shape[0], target_shape[1], target_shape[2])

浏览 0提问于2020-08-19得票数 1

2回答

根据每一行的第一个元素返回NumPy数组的子集

python、arrays、numpy、vectorization

我试图获取给定的NumPy数组列表的子集x，以便每一行的第一个元素必须位于列表r中。 >>> import numpy >>> alist = numpy.array([(0, 2), (0, 4), (1, 3), (1, 4), (2, 1), (3, 1), (3, 2), (4, 1), (4, 3), (4, 2)]) >>> alist array([[0, 2], [0, 4], [1, 3], [1, 4], [2, 1], [3, 1], [3, 2], [4, 1], [

浏览 3提问于2016-12-20得票数 4