如何比较两个pandas数据帧并返回将它们相互映射的索引？_如何比较两个pandas数据帧的行并返回值？_如何获取多个数据帧的公共索引，并返回它们的行和数据帧？ - 腾讯云开发者社区

python、pandas、matplotlib

我有两个数据帧，具有唯一的x和y坐标，我想将它们绘制在同一张图中。我现在用相同的图形绘制两个数据帧： plt.plot(df1['x'],df1['y']) plt.plot(df2['x'],df2['y']) plt.show 但是，pandas还具有绘图功能。 df.plot() 我如何使用pandas功能来实现与第一个示例相同的功能？

浏览 2提问于2016-05-24得票数 11

回答已采纳

1回答

如何更改隔离林的输出数据格式

scikit-learn、isolation

我已经构建了一个隔离林来检测我拥有的csv文件的异常，我想看看如何更改数据的格式。现在，异常数据正以pandas数据帧的形式输出，但我想将其更改为json文件，格式如下： {seconds: #seconds for that row, size2: size2, pages: #pages for that row} 我附上了代码和数据的样本，非常感谢！ model.fit(df[['label']]) df['anomaly']=model.fit_predict(df[['size2','size3','size4&

浏览 4提问于2020-06-13得票数 0

2回答

pandas等同于R的cbind (垂直连接/堆叠向量)

python-3.x、pandas、concat、cbind

假设我有两个数据帧： import pandas .... .... test1 = pandas.DataFrame([1,2,3,4,5]) .... .... test2 = pandas.DataFrame([4,2,1,3,7]) .... 我尝试过test1.append(test2)，但它相当于R的rbind。如何将这两列合并为数据帧的两列，类似于R中的cbind函数？

浏览 4提问于2015-02-19得票数 45

回答已采纳

3回答

Pandas比较两个数据框并查找重复元素

python、pandas、data-science、equals

我想比较一下df和df_equal。df包含多个单独的数据帧 import pandas as pd df1 = pd.DataFrame([[ 'b', 'b', 'b' ]], columns=['a', 'b', 'c']) Output: a b c 0 b b b df2 = pd.DataFrame([[ 'x', 'x', 'x' ]], column

浏览 41提问于2020-05-17得票数 0

回答已采纳

2回答

如何将包含字符串值的pandas数据帧的列转换为int/float？

python、pandas、svm

我有一个pandas dataframe，它包含一个非数字值的列。如何将它们转换为整型/浮点型。 eq： Col1 Col2 Lip_GD 267 Gly_hy_68 467 Hint_2 628 Jac+Jac 339 Lip_GD 234 Jac+Jac 267 当我将这些数据读入pandas数据帧时，我将如何将列1转换为int？

浏览 4提问于2015-11-26得票数 3

1回答

如何将Pandas列切片转置并插入行切片？

python、pandas、insert、slice、transpose

尝试从一个Pandas数据帧中提取列的切片，转置该切片，并将其插入到不同数据帧中类似大小的行切片中。两个数据帧中的标签和索引不同。对于大型数据帧，我目前正在运行for循环，逐个单元格地复制每个值，但效率非常低。除了for循环，我已经尝试了.loc，.iloc，与转置，但没有成功。pivot，pivot_table，melt在这里似乎不适用，否则我无法理解如何将它们应用于这个看似简单的问题。 # Two dataframes here import pandas as pd import numpy as np numRng = np.arange(20).reshape((5, 4)) df

浏览 15提问于2019-07-10得票数 1

回答已采纳

2回答

在pandas数据帧中插入sklearn CountVectorizer的结果

python、pandas、machine-learning、scikit-learn

我有一堆14784个文本文档，我正在尝试对它们进行矢量化，这样我就可以运行一些分析。我使用sklearn中的CountVectorizer将文档转换为特征向量。我这样做是通过调用： vectorizer = CountVectorizer features = vectorizer.fit_transform(examples) 其中examples是所有文本文档的数组现在，我正在尝试使用其他功能。为此，我将这些特性存储在一个pandas数据帧中。目前，我的pandas数据帧(不插入文本特征)具有形状(14784, 5)。我的特征向量的形状是(14784, 21343)。将矢量化的特征插入

浏览 0提问于2016-11-02得票数 14

1回答

Pandas如何在不丢失列标题的情况下连接两个数据帧

python、pandas

我有以下玩具代码： import pandas as pd df = pd.DataFrame() df["foo"] = [1,2,3,4] df2 = pd.DataFrame() df2["bar"]=[4,5,6,7] df = pd.concat([df,df2], ignore_index=True,axis=1) print(list(df)) 输出：[0,1] 预期输出：[foo,bar] (顺序并不重要) 如果我能保证两个数据帧的标题是唯一的，有没有办法在不丢失原始列标题的情况下连接两个数据帧呢？我想到了遍历这些列，然后

浏览 1提问于2017-04-14得票数 16

回答已采纳

1回答

如何将MultiIndex熊猫数据帧转换为Dask数据帧

python、pandas、dataframe、dask、multi-index

我试图将两个变量(一个ID和一个DateTime变量)为MultiIndexed的熊猫数据帧转换为dask数据帧，但是我得到了以下错误； "NotImplementedError: Dask does not support MultiIndex Dataframes" 我正在使用下面的代码 import pandas as pd import dask.dataframe as dd dask_df = dd.from_pandas(pandas_df) 实际上，我有700多个熊猫数据帧(每个超过100MB)，我计划将每个熊猫数据帧转换为dask，然后将它们全部附加到一

浏览 18提问于2019-07-02得票数 2

回答已采纳

3回答

在pandas中合并数据帧-继续获取键错误？

python、pandas

我正在尝试合并两个数据帧，testr和testc，但我一直在"Channel ID“上得到一个关键错误，并且不确定问题是什么。数据帧是否必须具有相同的大小或具有相同的数据类型才能使pd.merge工作？下面是我在每个数据帧上与.info()合并的代码： def matchID_RC(rev,cost): rc = pd.merge(rev, cost, on='Channel ID', how = 'outer') return rc testr.info() <class 'pandas.core.frame.DataF

浏览 1提问于2015-06-20得票数 2

2回答

这段代码是做什么的(排序多个数组)？

javascript、arrays

我正在搜索“如何同时排序多个数组”，并在这里发现了以下问题：亚历山大解决我的问题有一个很好的答案。但我不能从答案中完全理解这一部分： /* A shorthand function */ var comparator = function(arr) { return function(a, b) { return ((arr[a] < arr[b]) ? -1 : ((arr[a] > arr[b]) ? 1 : 0)); }; }; 有人能解释一下他的代码的这一部分是干什么的吗？

浏览 3提问于2016-09-20得票数 1

回答已采纳

1回答

pandas - get在具有相同维度的两个数据帧之间存在差异

pandas、dataframe

如何才能得到相同维度的两个pandas数据帧之间的差异： import pandas as pd df1 = pd.DataFrame({ 'x': ['a', 'b', 'c', 'd', 'e'], 'y': [1, 1, 1, 1, 1], 'z': [2, 2, 2, 2, 2]}) print(df1) df2 = pd.DataFrame({ 'x': ['

浏览 9提问于2021-09-02得票数 1

回答已采纳

3回答

比较pandas数据帧的行(行有一些重叠值)

python、pandas、dataframe

我有一个包含21列的pandas数据框架。我将重点放在具有完全相同的列数据值的行子集上，除了每行唯一的6个之外。我不知道这6个值对应的是先验的列标题。我尝试将每一行转换为Index对象，并对两行执行set操作。例如。 row1 = pd.Index(sample_data[0]) row2 = pd.Index(sample_data[1]) row1 - row2 它返回一个索引对象，其中包含row1独有的值。然后，我可以手动推断哪些列具有唯一值。如何以编程方式获取这些值在初始数据帧中对应的列标题？或者，有没有办法比较两个或多个数据帧行，并提取每行的6个不同的列值，以及相应的标题？理想

浏览 4提问于2013-05-14得票数 8

2回答

如何将if-else语句与python pandas dataframe isna()函数一起使用？

python-3.x、pandas、dataframe

我刚开始使用NaN数据帧，正在尝试找出一种在数据帧单元格内定位pandas值的方法。我在isna()函数中使用了if条件。我的方法是，如果值为NaN，则打印"value empty“而不是返回布尔值"True”。这是我的方法： import pandas as pd x= pd.read_csv("mdata_short.csv", header =[0]) print(x["retail_price"].iloc[12:13]) if x["retail_price"].iloc[12:13].isna() == True:

浏览 0提问于2019-05-27得票数 5

1回答

在python中只遍历特定范围的对象索引。

pandas、loops、object、indexing、append

我正在尝试基于该数据帧中的两个预先存在的列来附加一个pandas数据帧。我遇到的问题是pandas数据帧的索引是对象格式，而不是整数格式。让事情变得更复杂的是，我只想附加一定范围的数据帧，将新列中的剩余单元格保留为'NaN‘。为了仅附加到数据帧的特定范围内，我将不得不使用"for“循环。这是我的问题:当我有一个对象索引时，我如何遍历数据帧的某个范围？我最初的pandas数据帧很简单... import pandas as pd dates = ['2005Q4','2006Q1','2006Q2','2006Q3&#

浏览 0提问于2017-09-21得票数 0

1回答

如何在Pandas中比较两个数据帧并删除数据帧中不匹配的行？

python-3.x

我是python (尤其是熊猫)的新手。我有两个数据帧df1和df2。df1有200行。df2有250行。索引值也包含重复项。 df1: ProcessID 248 436 500 500 另一个数据帧 ProcessID Day Time Status 248 Sun 23:26:51 completed 436 Sat 01:50:56 completed 500 Thu 14:18:21 completed 500 Wed 23:00:15

浏览 3提问于2018-04-08得票数 0

2回答

谁能帮我理解一下.index在这段代码中做了什么？

python、pandas、indexing

我有以下代码： print(df.drop(df[df['Quantity'] == 0].index).rename(columns={'Weight': 'Weight (oz.)'})) 我知道query想要做什么，但我不明白为什么需要添加“.index”部分？ .index在这个特定的代码中做了什么？对于上下文，这里是数据帧的样子： ? 我查看了有关dataframe索引的python文档： https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Data

浏览 47提问于2019-10-02得票数 0

5回答

如何在pyspark中获取dataframe列的名称？

pyspark、pyspark-sql

在熊猫中，这可以通过column.name来完成。但是，当它的spark数据帧列时如何做同样的事情呢？例如，调用程序有一个spark数据帧: spark_df >>> spark_df.columns ['admit', 'gre', 'gpa', 'rank'] 此程序调用我的函数: my_function(spark_df 'rank‘)在my_function中，我需要列的名称，即’rank‘ 如果是pandas数据帧，我们可以在my_function内部使用 >>> pand

浏览 1提问于2016-09-28得票数 55

8回答

如何从另一个数据帧中删除pandas数据帧

python、pandas、dataframe、subtraction

如何从另一个数据帧中移除一个熊猫数据帧，就像集合减法一样： a=[1,2,3,4,5] b=[1,5] a-b=[2,3,4] 现在我们有两个pandas数据帧，如何从df1中删除df2： In [5]: df1=pd.DataFrame([[1,2],[3,4],[5,6]],columns=['a','b']) In [6]: df1 Out[6]: a b 0 1 2 1 3 4 2 5 6 In [9]: df2=pd.DataFrame([[1,2],[5,6]],columns=['a','b'

浏览 0提问于2016-05-19得票数 54

2回答

比较从excel导入的2个数据格式

python、excel、pandas、dataframe

我正在做数据比较项目。这里我有两个excel文件'Prod1‘和'Proj1’，它们是我在python中作为数据框架导入的。这两个数据帧都有46个具有相同标签的相同列。但是跨两个文件的行数不同(例如，Prod1有100行，而Proj1是110)。我想按单元格值比较单元格，并在另一个数据帧中突出显示错配为“TRUE”或“FALSE”。这可以在excel中进一步导出。到目前为止，我能够读取文件，但在比较部分被击中。请协助。 import os import pandas as pd import numpy as np import xlrd os.getcwd() os

浏览 0提问于2018-02-19得票数 0

回答已采纳

2回答

将分类列添加到数据框架中，并将类别与现有的分类列匹配

python、pandas

我有两个数据框架，包含逻辑上相互关联并包含相同数量类别的分类列( df1 <->类别1在df2中，类别2在df1 <->类别2在df2中，等等)。数据帧有不同的长度，行没有排序，所以我不能简单地重新排序和连接它们。我希望将df2的分类变量添加到df1中，以便两个分类列的类别匹配。下面是一个例子： import pandas as pd foo = pd.Categorical(values=[0,1,2,3],categories=[0,1,2,3],ordered=True) bar = pd.Categorical(values=['b',&#

浏览 2提问于2020-03-23得票数 0

回答已采纳

1回答

在Python 3中分析酸洗数据时出现问题

python、pandas、pickle

我有一个我想要分析的数据集(由于它的大小，我不能把它放在这里，但我可以描述它)它是一个腌制形式的字典，看起来像这样：姓名：(工资: x，奖金: y，email_address: z等)每个名称有21个属性和21个值(有些是数字，有些是布尔值，有些是字符串) 我使用pandas将数据存储在数据帧中 df = pd.read_pickle('data.pkl') 但与我之前操作过的熊猫数据帧不同，我似乎无法遍历这个数据帧。head()函数不起作用，keys()起作用，但它只显示文件中的名称。通过指定名称获取其他数据也是可行的(例如，打印df['john smith'

浏览 34提问于2018-07-09得票数 2

回答已采纳

1回答

通过将不同数据框的2列中的值视为范围来为数据框赋值

python、python-2.7、pandas、numpy、dataframe

下面的代码解释了这个场景，我有一个包含3列的数据帧(df_ticker import pandas as pd df_ticker = pd.DataFrame({'Min_val': [22382.729,36919.205,46735.164,62247.61], 'Max_val': [36901.758,46716.06,62045.06,182727.05], 'Ticker':['$','$$','$$$','$$$$']}) df_ticker`

浏览 0提问于2018-03-16得票数 1

2回答

比较Pandas中的id日期组合

python-3.x、pandas、dataframe、compare

我完全是Pandas的初学者，我想知道如何比较一个数据帧中的行对组合与另一个数据帧中的行对组合。我有df： id dates 0 A 2000-01-01 1 B 2000-01-02 2 C 2000-01-03 并想将其与df2进行比较： id dates 0 A 2000-01-01 1 B 2000-01-03 2 C 2000-01-01 3 D 2000-01-04 4 E 2000-01-05 对于df2中的每个特定id，它将相应的日期与df1进行比较(并告诉我df1中的日期是在上还是晚于df2

浏览 1提问于2020-09-14得票数 2

3回答

获取列与特定值匹配的dataframe中的整数行索引

python、pandas、select、dataframe、indexing

给定一个Pandas数据帧，其中一列如下所示： Date 2016-04-15 2016-04-14 2016-04-13 2016-04-12 2016-04-11 2016-04-08 假设值是唯一的，我如何获得特定值的行索引？例如，"2016-04-13“将返回2

浏览 0提问于2016-05-29得票数 5

回答已采纳

4回答

如何按行对数据帧进行排序？

python、pandas、dataframe

我有一个数据框架： import pandas as pd df = pd.DataFrame(data={'x':[7,1,9], 'y':[4,5,6],'z':[1,8,3]}, index=['a', 'b', 'c']) 它显示：如何按行‘a’对此数据帧进行排序:对数据帧进行排序后，可能是：

浏览 0提问于2016-08-14得票数 1

1回答

Pandas中不同样本时间序列的线性插值比较

pandas、time-series

背景：我有一个月的实验数据。有些数据值是周期性的，但并没有将其均匀地分成一整天。因此，测量从午夜第一天开始，第一天在00:03开始，第二天从00:07开始，所以每天的数据读数都会发生变化。此外，读数之间的频率略有变化。在前3天重复实验条件，比较中间三天的效果。目标：我想比较一下重复的日子，看看它们之间的不同。问题:应该比较第1天和第25天的，但是相对的日均时间不一致，所以我想将第一天的线性插值与第25天的数据点进行比较。也就是说，对于第25天的每一个时间增量(相对于一天的开始)，我想从第一天减去相同的点。如果在第一天没有对应的点，我想使用最接近的点之间的线性插值。到目前为止，：I将Pan

浏览 0提问于2018-03-20得票数 2

回答已采纳

2回答

索引到Dask系列可以返回Dask系列

python、pandas、dask

我有Dask系列的Dask数据帧。我想在本系列中建立索引，以获取dask数据帧以供后续工作使用。但是，使用loc[0]会导致另一个dask系列。使用to_frame也不起作用，因为结果是"Dask系列Dask数据帧的Dask数据帧“。下面是一个使用Dask系列Pandas数据帧的最小示例(不完全相同，但说明了问题)： import pandas as pd import dask.dataframe as dd pdf1 = pd.DataFrame({'a': [1,2,3,4], 'b': [4,3,2,1]}) pdf2 = pd.Data

浏览 3提问于2020-02-03得票数 1

1回答

如何使用正则表达式删除python pandas DataFrame中的行？

python、regex、pandas

我有一个模式： patternDel = "( \$(MoM|QoQ)\$)"; 我想删除pandas dataframe中列df['Event Name']与此模式匹配的所有行。哪种方法是最好的？数据帧中有超过100k行。

浏览 8提问于2016-10-10得票数 26

回答已采纳

1回答

如何在Python/Pandas中将循环的垂直列转换为行，然后将它们堆叠在一起？

python-2.7、pandas、dataframe、transpose、data-manipulation

我首先垂直生成一些数据，但希望将它们转置为行数据，然后将它们堆叠到一个类似Pandas数据帧的数组中。如何获得包含4列('fr'，'en'，'ir'，'ab')和3行的熊猫数据帧的最终结果？ # coding=utf-8 import pandas as pd from pandas import DataFrame, Series import numpy as np import nltk import re import random from random import randint import csv import

浏览 1提问于2015-10-20得票数 2

1回答

如何减去两个数据帧行？

python、pandas、dataframe、subtraction

如何减去两个数据帧？我有两个数据帧，A和B。我想减去它们(A-B)。这样，A中B的行将从A中删除。有关更多解释:我想删除B中重复的A中的行。例如：然后我需要一个函数来执行A-B，并给出以下结果：你知道pandas中的这个函数或方法吗？

浏览 1提问于2020-07-12得票数 0

2回答

如何使用Pandas选择两列的项目与两个列表(相同索引)的项目匹配的行？

python、pandas、select

这个问题与回答的问题相同，但扩展到了两个条件句。这可能很棘手，因为不能使用Pandas方法'isin‘，因为这将导致在我的两个列表中查看项目的组合，而我想要的是比较(并选择)与具有相同索引的列表项目相对应的数据帧项目(例如，从X=x1、x2、...xn、Y=y1、y2、..yn列表中选择成对的xn、yn )。如果需要，可以将列表转换为数据帧。有没有办法将其推广到Pandas中的多个(两个以上)条件句？

浏览 5提问于2018-02-22得票数 1

回答已采纳

3回答

如何加速将数据帧导入pandas

python、pandas、dataframe

我理解pandas导入csv文件相对较慢的原因之一是，在猜测类型之前，它需要扫描一列的整个内容(请参阅关于pandas.read_csv的low_memory选项的讨论)。我的理解正确吗？如果是这样的话，什么样的格式才是存储数据帧的好格式，哪些格式显式地指定了数据类型，这样pandas就不必去猜测了(SQL暂时不是一个选项)？有什么特别的选择吗？我的数据帧有浮点数、整数、日期、字符串和Y/N，所以只支持数字值的格式是行不通的。

浏览 0提问于2017-11-15得票数 2

3回答

Python pandas数据框移除索引名称未出现在其他数据框中的行

python、pandas、dataframe

我有两个数据帧。我想删除索引没有出现在两个数据框中的行。以下是数据帧的示例： import pandas as pd data = {'Correlation': [1.000000, 0.607340, 0.348844]} df = pd.DataFrame(data, columns=['Correlation']) df = df.rename(index={0: 'GINI'}) df = df.rename(index={1: 'Central government debt, total (% of GDP)'}

浏览 0提问于2018-10-31得票数 3

1回答

在Pandas中将数据帧细分为多个数据帧

python、list、pandas、dataframe

我有一个Pandas数据框架，它有51034行和10列。我想根据包含要切片的行的列表将这个数据帧分割成158个较小的数据帧。如何将熊猫数据帧分割成更小的数据帧？例如，如果我有一个10行4列的数据框架： A B C D 0 1 2 3 4 1 5 6 7 8 2 9 10 11 12 3 13 14 15 16 4 17 18 19 20 5 21 22 23 24 6 25 26 27 28 7 29

浏览 2提问于2015-05-13得票数 2

回答已采纳

2回答

返回dataframe值不同的列

python-3.x、pandas

我有两个类似下面的df1和df2示例的数据帧。我想要比较数据帧之间的值，并返回数据帧在列中具有不同值的列。因此，在下面的示例中，它将返回B列。 df1 A B C 1 2 3 1 1 1 df2 A B C 1 1 3 1 1 1

浏览 5提问于2018-10-03得票数 0

1回答

从Pandas DataFrame或CSV生成图形工具图

python、pandas、graph、graph-tool

我已经开始使用graph-tool，希望它是一个python库，允许我分析大型图(~8M顶点，~22M边，在Pandas DataFrame /CSV中)。“‘source”和“target”列是特定数字服务的用户ids。我从一个玩具示例开始，遵循方法。 import pandas as pd df = pd.DataFrame({'source':range(11,15), 'target':range(12,16)}) g = Graph(directed=True) g.add_edge_list(df.values) 在我的虚拟示例中，您可以看到

浏览 5提问于2017-07-28得票数 2

回答已采纳

1回答

当第3行的数据长度大于标题长度时，Python pandas.readexcel(文件路径，header=[0,1])会失败。欢迎任何解决方案的建议

python、excel、pandas、numpy、dataframe

我已经定义了我的excel(xlsx)的前两行，即0,1作为头文件。为简单起见，excel文件只有一张工作表。在最初的两行之后，文件中的数据行很少。由于有两个头文件，pandas给了我一个多索引的数据帧，这很好。 dataframe = pandas.readexcel(filepath, header=[0,1]) 当一个文件的所有行都达到头的宽度时，上面这行代码就会给我一个有效的数据帧。这是问题所在。在我的一个excel文件中，标题行有65个excel列，有些数据行有66列。熊猫无法执行 dataframe = pandas.readexcel(filepath, header=[0,

浏览 0提问于2018-11-29得票数 0

2回答

在pandas中使用字母定位元素背后的逻辑是什么？

python、pandas

我有CSV文件。我将它加载到pandas数据帧中。现在，我正在练习loc方法。这个CSV文件包含一个占士邦电影的列表，我在loc方法中传递字母。我无法解释所显示的结果。 bond = pd.read_csv("jamesbond.csv", index_col = "Film") bond.sort_index(inplace = True) bond.head(3) bond.loc["A": "I"] 上述代码的结果为： ? bond.loc["a": "i"] 上面代码的结果是：

浏览 94提问于2021-11-23得票数 0

回答已采纳

1回答

Pandas:获取由pandas.DataFrame.update更新的单元格

python、pandas、dataframe

我正在使用pandas.DataFrame.update合并两个数据帧，如下所示 import pandas as pd df1 = pd.DataFrame( {'ID': [101, 102, 103], 'A': ['..', '..', '..'], 'B': ['..', '..', '..'], }).set_index('ID') df2 = pd.DataFrame( {

浏览 26提问于2020-11-10得票数 1

回答已采纳

1回答

如何使用其中一个数据帧的索引合并数据帧？

python、pandas

我有两个数据帧(A和B)如下： *类型为： <class 'pandas.core.frame.DataFrame'> ->A <class 'pandas.core.frame.DataFrame'> ->B 答： target 145 1 557 1 240 1 893 1 1518 0 1145 0 B： RF LR NB DT SVM Knn SUM 0 1 0 0 1 1

浏览 0提问于2018-11-14得票数 0

3回答

如果我使用python pandas，还需要结构化数组吗？

numpy、scipy、pandas

既然pandas提供了数据帧结构，那么numpy中还需要结构化/记录数组吗？我需要对需要这种结构化数组类型框架的现有代码进行一些修改，但从现在开始，我正在考虑使用pandas代替它。我会不会发现我需要一些pandas不提供的结构化/记录数组的功能？

浏览 2提问于2012-08-21得票数 22

回答已采纳

2回答

在pandas中连接两个数据帧的行

python、pandas、dataframe

我需要一个接一个地连接两个具有相等行数(nRow)的数据帧df_a和df_b，而不考虑任何键。此函数类似于R programming language中的cbind。每个数据帧中的列数可能不同。所得到的数据帧将具有相同的行数nRow和等于两个数据帧中的列数之和的列数。换句话说，这是两个数据帧的盲列连接。 import pandas as pd dict_data = {'Treatment': ['C', 'C', 'C'], 'Biorep': ['A', 'A', 'A

浏览 0提问于2015-01-25得票数 79

回答已采纳

1回答

基于多列的数据帧间相交消除

python、pandas

我有这两个数据帧： df_test dimension1_id dimension2_id dimension3_id dimension4_id dimension5_id \ 0 -1 -1 -1 -1 -1 1 1177314888 238198786 5770904146 133207291 Exact 2 1177314888 238198786 5770904266 18395155770

浏览 1提问于2016-05-16得票数 5

回答已采纳

1回答

熊猫:遍历一个DataFrames列表，并将每个列表导出到excel工作表

excel、python-3.x、pandas、xlsxwriter

试着教自己编码，使工作中的一些乏味的任务自动化。我对任何无意中的无知表示歉意。我在熊猫中创建了数据帧(python3.x)。我想将每个数据帧打印到不同的excel工作表中。这是我对两个数据帧的功能，它工作得很完美，但是我想要将它放大，循环通过一个数据帧列表，这样我就可以使它更加动态一些。 writer = pandas.ExcelWriter("MyData.xlsx", engine='xlsxwriter') Data.to_excel(writer, sheet_name="Data") ByBrand.to_excel(writer,

浏览 1提问于2016-05-02得票数 3

回答已采纳

1回答

组合一个数据文件列表

python-3.x、pandas、indexing、concat

我有一个有几个..csv文件的文件夹。每个包含数据的时间，高，低，开放，Volumefrom，Volumeto，加密货币关闭。我成功地将.csvs加载到一个数据文件列表中，并删除了列Open、High、Low、Volumefrom、Volumeto，这是我不需要的，给我留下了时间，并关闭了每个数据帧。现在我想把数据列表组合成一个数据，索引以最小的硬币的时间戳开始，在这个例子中是iota。这是我到目前为止编写的代码： import pandas as pd import os # Path to my folder PATH_COINS = r"C:\Users\...\C

浏览 1提问于2018-09-25得票数 0

2回答

读取多个文件，并将它们堆叠到单个多级数据帧中。每个文件都有相同的列名

python、database、pandas

我想问一下，是否有人知道如何使用多级索引将多个数据帧堆叠成一个单独的数据帧，而不是像我正在做的那样堆叠成一个数据帧列表。谢谢 import glob import pandas as pd glist=glob.glob("./path/*.csv") D=[] for file in glist: X=pd.read_csv(file,names=['name1','name2','name3'],index_col = 0, header=0) D.append(X)

浏览 3提问于2017-08-11得票数 0

2回答

查找具有DataFrame值的NaN列表的索引- Pandas

python、list、pandas、dataframe、indexing

我有一个数据帧列表，其中一些数据帧具有NaN值。到目前为止，我可以使用这个NaN来识别单个数据帧的值。如何找到数据帧具有NaN值的列表的索引。 dffs样本列表， [ var1 var1 14.171250 13.593813 13.578317 13.595329 10.301850 13.580139 9.930217 NaN 6.192517 13.561943 NaN 13.565149 6.197983 13.572509, var1 var2 2.456183

浏览 2提问于2017-07-25得票数 4

回答已采纳

1回答

在某些条件下，数据帧为每行拆分为多个数据帧

python、pandas

我有一个这样的数据帧。 A,B 1,2 3,4 5,6 7,8 9,10 11,12 13,14 我想在数据帧上拆分这部分。拆分的数据帧应该每三行包含一次。拆分的第一个数据帧可以包含从索引0到索引2。第二个包含从索引1到索引，依此类推。 A,B 1,2 3,4 5,6 A,B 3,4 5,6 7,8 A,B 5,6 7,8 9,10 诸若此类。我一直在使用forloop，然后使用iloc，然后将这些拆分的dataframe添加到列表中。我正在寻找是否有一些矢量化方法来在pandas中拆分上述数据帧。数据帧很大，使用forloop遍历每一行都很慢。

浏览 13提问于2020-12-21得票数 0

回答已采纳

1回答

在python中基于部分字符串匹配连接到数据帧

python、pandas、nlp、nltk

我有两个数据帧，有一个共同的关键产品名称，我想做的是通过连接前两个数据帧来创建第三个数据帧，这两个数据帧基于80-90%的相似度的部分字符串匹配，数据集相当大，我已经尝试使用scikit-learn的tfidf，但我一直丢失我的参考索引。在下面的例子中:迷你无线蓝牙运动立体声耳机和OnePlus 6砂岩保护套都需要在df3中，帮助将非常感谢。输出示例： import pandas as pd df1=pd.DataFrame({'Product_Name1': ['Mini Wireless Bluetooth Sports Stereo Headset',

浏览 12提问于2018-12-19得票数 0