Pandas:不同大小的DataFrames之间的复杂映射

、、

我有两个完全不同的数据帧需要映射(感谢生物学)。所有关于pandas的教程都是基于更简单的转换，如果没有4个嵌套循环，我就不能解决这个问题(真正的新手)，但没有成功。真的很好奇，想用一种简单的方法来解决这个问题，而不需要回到Excel。import numpy as np

浏览 5提问于2017-07-07得票数 1

回答已采纳

1回答

是否有相当于Spark的Apache Arrow

、、、、

Spark提供了几种实现的不同方法。我目前正在使用，它以两个(共同分组的) Pandas DataFrames作为输入，并返回第三个。为了在DataFrames和Pandas DataFrames之间进行有效的转换，Spark使用Apache内存布局，但是仍然需要从Arrow转换到Pandas并返回。我真的很想直接访问Arrow数据，因为这就是我最终将如何处理UDF中的数据(使用)

浏览 3提问于2022-03-24得票数 5

1回答

Pandas -合并不同大小的DataFrames

、

我在合并具有不同行数的两个帧时遇到问题。第一个数据帧有5K行，第二个数据帧有20K行。在两个帧中都有一列"id“，所有5K "id”值都将出现在20K行的帧中。我正在寻找的操作是保留大数据帧中的所有行，并为大框架中不存在的数据粘贴NAN值。谢谢

浏览 3提问于2017-02-17得票数 1

回答已采纳

3回答

覆盖不同大小pandas的DataFrames中的列

、、

ids':[1,2,3,4,5],'cost':[0,0,1,1,0]})每当ids匹配时，我想用df2上的值更新df1的值。所需的数据帧如下所示：我怎样才能从上面的两个数据帧中得到它呢？

浏览 16提问于2017-03-02得票数 4

回答已采纳

3回答

Pandas力矩阵乘法

、、、、

我想使用Python Pandas强制矩阵乘法“定向”，在DataFrames对抗DataFrames，Dataframes对抗系列和系列对抗系列之间。作为示例，我尝试了以下代码：print(t.T.dot(t))但我希望是这样的： 2 4] Pandas很棒，但是不能以我想要的方式做矩阵乘法是最令人沮丧的PS:我知道Pandas<

浏览 0提问于2013-04-09得票数 2

回答已采纳

1回答

将Pandas数据帧存储在字典或面板中更好吗？

、、、、

我希望这听起来不是一个有待讨论的问题。我将就我的具体情况给出一些细节。我将这些数组存储为Pandas DataFrames，但是为了将它们保存在一个对象中，我想到了两个选项：将DataFrames存储在字典中，其中键是时间戳。将DataFrames存储在Pandas中，其中项目

浏览 2提问于2016-02-25得票数 5

1回答

使用psutil.Process.memory_info内存与使用Pandas.memory_usage不同

、、

我正在分析一个利用Pandas来处理一些CSV的程序。我使用psutil's Process.memory_info报告虚拟内存大小(vms)和驻留集大小(rss)值。我还使用Pandas DataFrame.memory_usage (df.memory_usage().sum())来报告内存中dataframes的大小。报告的vms值和df.memory_usage值之间存在冲突，其中Panda

浏览 5提问于2019-10-14得票数 10

3回答

基于部分匹配的两只熊猫DataFrame合并

、

两个DataFrames有不同格式的城市名称。我想为两个geo中的字段City之间的所有部分字符串匹配做一个左外部联接和拉出DataFrames字段。import pandas as pd 'City': ['San Francisco, CA','Oakland,Francisco-Oakland, CA',

浏览 9提问于2021-09-09得票数 14

回答已采纳

1回答

互相减去两个熊猫DataFrame时间索引？

、、、

我有两个DataFrames (比如A和B)，每个索引都是pandas.tseries.index.DateTimeIndex类。3434 诸若此类。

浏览 1提问于2015-11-16得票数 0

回答已采纳

1回答

Pandas:用两种不同大小的Dataframes计算

、、

我有两种不同大小的数据，我想用它们来计算。第一个数据集是时间序列。第二个数据集是长期月平均数。0.0000009 0.00000011 2.350980我所使用的代码包括如下month'])我尝试过从原始数据中减去oavg，但是第一个数据值最终变成了一个NaN (

浏览 0提问于2015-04-27得票数 3

回答已采纳

1回答

在多对多关系上使用Sqlalchemy和Pandas大容量插入

、、

我有5个pandas DataFrames，它们表示现有PostgreSQL数据库中通过多对多关系链接的表。我的问题是如何将这些数据帧中的数据插入到数据库中。到目前为止，我已经使用automap()获取了sqlalchemy ORM对象，但这是遍历每个数据帧行并为该数据行创建一个ORM对象的最佳方法。然后，我想我必须循环遍历每个对象，并使用.add()来映射所有对象之间的关系。这是最好的方法吗？看起来是多余和低效<

浏览 1提问于2018-03-29得票数 1

1回答

从几个文件中拆分相同值文本的好方法

、、、、

data3, data33, data3333, data33333 (5 dimension with 3000 value each)for i in range(len(limit_value_text)): for g in range(len(driver

浏览 0提问于2020-06-11得票数 0

1回答

用HDFStore保存的空pandas* DataFrames会生成非常大的HDF文件*

、、、

使用pandas HDFStore存储空DataFrames会消耗大量磁盘空间。下面是一个例子： with pd.HDFStore('/tmp/test_empty.hdf') as s:test_nan.hdf') as s: s[key] = pd.DataFrame([pd.np.nan])

浏览 1提问于2015-11-12得票数 1

1回答

Python:以CSV表为例，查找4个最高值及其位置

、、、

我有一个包含310个.csv文件的文件夹。下面是内容的示例我需要创建一个程序来遍历所有的文件，列出文件名，然后列出表中的前4个值以及与它相关的x值。理想情况下，所有这些都会保存到文本文档中，但只要它以可读的格式打印，这将是理想的。

浏览 4提问于2022-08-02得票数 0

1回答

大量均匀数据的快速级联

、

我有大约7000个同构的DataFrames (相同的列，但大小不同)，并且希望将它们连接到一个大的DataFrame中进行进一步的分析。如果生成所有这些数据并将其存储到list中，内存就会爆炸，因此我无法使用pandas.concat([...all my tables...])，但选择执行以下操作：for table in readTables(): big_table = pandas

浏览 3提问于2015-07-09得票数 0

回答已采纳

1回答

大熊猫一张纸制作数据

、、

我有一个复杂的表格在excel中，我希望读到多个pandas.DataFrames。基本上，这里有3条数据。一个是DIRECTION_A，DIRECTION_B和TOTAL。我可以使用iloc来指定边界，但是由于我正在迭代许多不同的电子表格，因此存在不同位置的风险。

浏览 2提问于2017-03-17得票数 2

回答已采纳

1回答

Pandas中DataFrames列表的逐行映射

、、、

我在Python (3)中有一个带有布尔值的数据帧列表，我想要按行顺序和列表的数据帧，但我不知道如何做到：d3 = pd.DataFrame({'v' : [False, True, False, True]}) 我想要的是一个值为False、True、False、True的数据框架。我尝试过在

浏览 1提问于2018-10-04得票数 1

回答已采纳

1回答

基于另一个dataframe值填充Pandas/Python列

、、

我是一个长期潜伏的人，我设法抓住了一个新的项目，涉及到一些数据吞噬。具体地说，我有大约5k个主记录，我需要向其中添加一个具有特定值的列。现在，该值位于另一个dataframe/csv中，我打算根据主记录中的一个值匹配这两个值。关键细节:我将主记录与之配对的另一个列表只有60个可能的值。有点像如果我想要将州插入到地址文件中，如果我只有一个城市和州内的城市列表。谢谢你的帮助!

浏览 17提问于2020-08-06得票数 0

6回答

将x和y标签添加到熊猫图中

、、、

假设我有以下代码，它使用pandas绘制一些非常简单的东西：values = [[1, 2], [2, 5]] title='Video streaming dropout by category')如何轻松设置x和y标签，同时保留使用特定色彩映射表的能力我注意到pandas DataFram

浏览 84提问于2014-02-01得票数 245

回答已采纳

1回答

Pandas和Pandas被证明可以一起工作吗？

、、、、

我面临许多问题，集成/添加Pandas现有代码的Pandas代码。1)如果我将Pandas dataframes转换为，那么多个操作就无法很好地转换，因为Pandas dataframes似乎没有Pandas dataframes那么丰富。2)如果我选择使用Pandas和pandas在同一代码中处理不同的数据集，当通过map调用的函数包

浏览 2提问于2017-12-26得票数 6

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

是否有相当于Spark的Apache Arrow

Pandas -合并不同大小的DataFrames

覆盖不同大小pandas的DataFrames中的列

Pandas力矩阵乘法

将Pandas数据帧存储在字典或面板中更好吗？

使用psutil.Process.memory_info内存与使用Pandas.memory_usage不同

基于部分匹配的两只熊猫DataFrame合并

互相减去两个熊猫DataFrame时间索引？

Pandas:用两种不同大小的Dataframes计算

在多对多关系上使用Sqlalchemy和Pandas大容量插入

从几个文件中拆分相同值文本的好方法

用HDFStore保存的空pandas* DataFrames会生成非常大的HDF文件*

Python:以CSV表为例，查找4个最高值及其位置

大量均匀数据的快速级联

大熊猫一张纸制作数据

Pandas中DataFrames列表的逐行映射

基于另一个dataframe值填充Pandas/Python列

将x和y标签添加到熊猫图中

Pandas和Pandas被证明可以一起工作吗？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐