连接pandas数据帧的更多pythonic方式

文章/答案/技术大牛

发布

1回答

、、

所以我不得不写一些程序，对现有的pandas数据帧做一些操作，然后在for循环中从该数据帧到大数据帧的末尾。我已经找到了一种方法，通过将第一个数据帧设置为第一次迭代的结束数据帧，然后在以后的迭代中将数据帧连接到这个结束数据帧，但对我来说，这似乎不是最有效<e

浏览 7提问于2018-08-09得票数 0

回答已采纳

1回答

Python:使用多个响应构建字典(嵌套字典？)

、、

我正在尝试弄清楚如何在python中最有效地搜索大约2300万行CSV文件中的行。data" 02468“-->并返回5位邮政编码为02468的所有行，或返回data"02468"，只返回该行。数据目前位于一个很大的列表列表中。看起来我可能想要使用嵌套

浏览 10提问于2020-05-11得票数 1

2回答

检查两个数据文件的相等性

、、

检查两个数据格式是否相等的Pythonic方法是什么？我现在所做的是：使用pandas.DataFrame.reset_index()重新设置数据帧排序后的索引使用pandas.DataFrame.sort_index()按行和列对数据<em

浏览 2提问于2017-02-13得票数 2

1回答

逗号分隔的in字符串映射到python Pandas中的值

、

我在pandas DataFrame的列中有一个逗号分隔的字符串： ? 我有一个映射数据帧 ? 我想要最终的数据帧： ? 我想要一个新的列，并用映射数据帧中的值替换ids，写pythonic + pandas的方法是什么？

浏览 22提问于2021-11-02得票数 0

回答已采纳

1回答

pandas条件选择-返回视图而不是副本

、、

我有一个原始的pandas Dataframe，它有一个对象链在上面做条件选择。每次我进行条件选择时，pandas都会创建一个新的数据帧。换句话说： import pandas as pd print(id(df)) df2 =我现在知道，因为我将变量df重新绑定到一个新的DataFrame (一个新对象)，它的ID改变了，

浏览 22提问于2019-03-01得票数 3

2回答

熊猫数据框架中的值替换

我正在寻找一种根据值是否很小来替换值的pythonic方法。假设我有一个数据框架：我想替换x上小于2乘2、大于4乘4的值。类似地，用y值替换小于5的值和大于7乘7的值，以便得到这个数据帧： ds = pandas.DataFrame({'x&#

浏览 1提问于2019-08-14得票数 1

回答已采纳

1回答

如何通过执行连接将新数据添加到TfRecord

、、

我有一堆tensorflow记录(这些不是我创建的)。但是，我需要通过连接另一个数据源(一个大的查询表)来添加更多的特性。如何编辑tf记录，是否将其转换为TfDataset，或者是否需要以某种方式将其转换为pandas数据帧，并连接数据并将其写为tfrecord？有谁有例子吗？

浏览 20提问于2020-07-15得票数 0

2回答

pandas:数据帧逐行比较

、、

我有两个数据帧，我想以行的方式比较它们是否相等。我感兴趣的是计算非连接属性具有相同值的行数。例如, df1 = pd.DataFrame({'a': [1,2,3,5], 'b': [2,3,4,6], 'c':[60,20,40,30], 'd':[df2 = pd.DataFrame({'a': [1,2,3

浏览 12提问于2020-02-29得票数 0

回答已采纳

1回答

要列出的python dataframe字符串

、

我得到了一个包含以下内容的excel文件，A 123C 127我想知道pythonic的方式来转换成一个列表，而不是写一个循环。Name id B [124,125,126] 这样我就可以用下面提到的</e

浏览 0提问于2017-10-19得票数 0

1回答

使用列表中的名称创建数据帧

、、、、

我有很多带标签的excel文件。我想把它们都连接起来，一次一个制表符。(files[0]).sheet_names 现在，假设我的标签是alpha，beta，gamma等，我想创建一个数据帧df_alpha，df_beta等的列表，它们是中文件的所有alpha标签的并集。我的目录。通过执行以下操作： for sheet in sheets: for f

浏览 15提问于2021-04-14得票数 3

回答已采纳

1回答

连接后条件下SQL更新的Pandas等效项

、、

我正在尝试将SQL查询翻译成python/pandas语言，即根据条件和两个表的内部连接为pandas数据帧的某些子集设置新值。table1.colA = table2.colBWHERE table1.colX Is Null; 到目前为止，我已经得到了下面提到的pandasmerge函数，但我不能100%确定我是否得到了正确的结果，以及代码是

浏览 7提问于2019-11-25得票数 0

1回答

基于xlsxwriter中的列对数据进行排序

、

有没有办法在使用xlsxwriter将数据写入excel之前对数据进行排序？我正在尝试创建基于odoo中的列的排序的excel报告。

浏览 18提问于2018-12-12得票数 1

2回答

Pandas中从列的行中删除特殊字符的大多数Pythonic方法

、

当我在我的Pandas数据帧上调用df.head()时，我得到了以下结果： 0 New YorkÊ4 HoustonÊ Name: cities, dtype: object 如您所见，在cities列的末尾有一个额外的字符所以，我用下面的代码删除了这个字符： df['cities']

浏览 7提问于2021-01-03得票数 0

回答已采纳

1回答

如何用pythonic方式填充Pandas数据帧的缺失记录？

、

我有一个熊猫数据帧'df‘，如下所示：IX1 IX2 A2 20 30B B2 2030它丢失了一些行，我想像这样填充中间的空白处：IX1 IX2 A2 20 30 A4 NaN NaNB B2 20 30 B3 NaN

浏览 0提问于2012-09-12得票数 12

回答已采纳

1回答

数据查询结果到字符串

、、

, "b", "c"],}) 只是想知道这是否是处理pandas.core.series.Series对象的正确方式(即是否有更多的Pythonic方式来处理这个问题)。

浏览 3提问于2022-05-26得票数 0

1回答

区分pandas数据帧中的小数列和字符串列

、、、、

我需要识别数据帧中哪些列是小数，哪些是字符串。使用df.dtypes为两种列类型提供'object‘：import decimal 我使用下面的代码来知道哪些是小数，但是对于如此基本的东西，必须有更多<

浏览 0提问于2020-04-09得票数 0

1回答

我在spark数据帧中有非常大的数据集，它们分布在节点上。如果我想使用像Jarque-Bera (JB)或Shapiro Wilk(SW)等高级统计测试，我会使用像scipy这样的python库，因为标准的apache pyspark库没有它们。但为了做到这一点，我必须将spark数据帧转换为pandas，这意味着将数据强制到主节点中，如下所示： import scipy.stats as stats pan

浏览 30提问于2020-09-13得票数 0

1回答

Python Pandas将数据帧转换为计数列表或向量

、、、、

我已经创建了以下pandas数据帧： +------+-------+------------++------+-------+-----|mv1 |1 |+------+-------+------------+ 我也有一个列表，上面有6部这样的电影： movies =['mv0', 'mv1', 'mv2',

浏览 10提问于2021-09-23得票数 0

回答已采纳

1回答

将数据从S3读取到pandas的最佳方法

、、、、

我需要将这两个CSV文件加载到pandas数据帧中，并对数据执行连接和合并等操作。另外，在我对数据帧执行了所需的操作之后，输出的数据</em

浏览 5提问于2020-05-06得票数 0

点击加载更多