Pandas DataFrame合并/联接_将pandas dataframe与空dataframe合并_合并Pandas DataFrame的字典 - 腾讯云开发者社区

、、

到目前为止，我还没有遇到这样的DataFrame操作问题。我想要实现的是，获得一个DataFrame，其中包含几年的每日数据和过去5天的小时数据。我的代码(完全运行)： import yfinance as yf import pandas as pd ticker = yf.Ticker('TSLA') fine = ticker.history(period='5d', interval='60m') fine.index = fine.index.tz_convert('UTC').tz_localize(None) p

浏览 1提问于2021-03-31得票数 1

回答已采纳

1回答

如何合并数据文件并创建嵌套表？

、、

我在python中创建了几个名为'Student‘的对象。每个对象都有包含诸如年龄、姓名和性别等信息的属性。此外，每个对象都有一个数据，这是一个学生在今年的考试成绩。我希望合并这些数据文件，并在不丢失它们的个人信息的情况下获得嵌套表。下面是python代码： import pandas as pd class Student: def __init__(age, name, gender, dataframe): self.age = age self.name = name self.gender = gender self.grades = dat

浏览 1提问于2022-08-24得票数 1

回答已采纳

1回答

将一列的值与另一列的值进行比较并合并

、、

我有两个数据，第一个dataframe包含来自给定位置的数据，第二个dataframe有带有坐标的数据以从第一个dataframe识别这些位置。我希望比较从第一个dataframe到第二个dataframe的县值的列值，然后在第一个dataframe的确切位置名称上附加坐标。以下是第一份数据文件： import pandas as pd boxes = {'ID': ['43001','43002','43003','43004','43005','43006','430

浏览 4提问于2022-05-20得票数 0

回答已采纳

5回答

熊猫合并如何保持秩序？

、

我在pandas中有两个DataFrames，试图合并它们。但是熊猫一直在改变顺序。我试过设置索引，重置它们，无论我做什么，我都不能得到返回的输出，使行的顺序相同。有什么窍门吗？注意，我们从贷款顺序'a，b，c‘开始，但在合并之后，它是’a，c，b‘。 import pandas loans = [ 'a', 'b', 'c' ] states = [ 'OR', 'CA', 'OR' ] x = pandas.DataFrame({ 'loan' : loans,

浏览 0提问于2013-11-26得票数 34

3回答

Python合并(并加入)不能通过后缀参数重命名列吗？

、、、、

我将按键列顺序合并一些数据帧，但我发现这些列没有按预期的方式用后缀参数重命名。我使用Python3.5和Panadas 0.19.2。 import pandas as pd df0 = pd.DataFrame({'serial_num': ['01', '02', '03'], 'vals': ['A2', 'A3', 'A6']}) df1 = pd.DataFrame({'serial_num': ['01', '02&

浏览 3提问于2017-05-17得票数 4

回答已采纳

3回答

在pandas中跨数据帧查找和链接值

、、、

在pandas数据帧中，例如： data = [['Ben', 'Apple', 'Banana'], ['Nancy', 'Pear', 'Apple'], ['Paul', 'Banana', 'Mango'], ['Sally', 'Mango', 'Pear']] df = pd.DataFrame(data, columns = ['Name', 'Like'

浏览 30提问于2021-03-22得票数 2

1回答

如何在Pandas merge中指定分层列？

、、、、

在对on在join中的工作方式产生了严重误解之后(剧透:与merge中的on非常不同)，下面是我的示例代码。 import pandas as pd index1 = pd.MultiIndex.from_product([["variables"], ["number", "fruit"]]) df1 = pd.DataFrame([["one", "apple"], ["two", "banana"]], columns=index1) index2 = pd.MultiI

浏览 12提问于2020-10-24得票数 0

回答已采纳

1回答

熊猫:当我们合并两个DataFrames时，为什么合并键的顺序是这样的呢？

、、

我是pandas的新手，我正在学习数据操作。在下面的示例中，当merging两个DataFrames具有一些相似的键时，为什么合并的DataFrame中的键顺序如下所示？我的问题是，输出不应该更像： |0. Z 1 3| |1. Y 2 2| |2. Z 3 3| 我的逻辑是，首先检查第一个数据中的每个键，然后在第二个键中检查每个键，因为这是第一次看起来是这样的。注:这是我第一次在这个平台上问任何问题，所以如果我做错了什么，请指导我。

浏览 2提问于2022-06-09得票数 0

3回答

合并两个pandas数据帧(在公共列上连接)

、、、、

我有两个数据帧： restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 non-null values

浏览 1提问于2013-09-14得票数 101

回答已采纳

3回答

Python Pandas将一系列字符串连接成一个字符串

、、、、

在python pandas中，有一个字符串值Series/dataframe列，可以组合成一个长字符串： df = pd.DataFrame({'text' : pd.Series(['Hello', 'world', '!'], index=['a', 'b', 'c'])}) 目标：“Hello world！” 到目前为止，像df['text'].apply(lambda x: ' '.join(x))这样的方法只返回序列。获得目标连接字符串的

浏览 7提问于2016-12-31得票数 13

回答已采纳

1回答

python pandas数据帧合并

、、

我想在python中使用for循环合并csv文件中的一些数据帧。但是结果是空的。为什么会这样呢？这是我的代码。 result = pandas.DataFrame(columns = ['col_A', 'col_B']) for i in range(0, 5): #col_A is integer for numbering, col_B is float in range 0 to 1 temp = pandas.DataFrame([[0, 0.5132443], [1, 0.12436421], [2, 0.12341162]], co

浏览 1提问于2017-05-27得票数 0

1回答

熊猫不加入"on“参数。

、

我试图在他们的“小时”列上join两个数据格式；一个数据格式包含11年期间每小时的日期时间和不同的平流参数，而另一个数据是11年内24小时中每个小时的平均值。请注意，由于当时的采样器维护，和两种数据格式都缺少第4小时，所以这是正常的。但是，当我join这两个数据帧时，第5小时被删除并跳过在右边的dataframe中，而从右dataframe到第6小时的数据与从左侧dataframe的第5小时对齐。这种不连续性一直重复到左侧数据中心的第22小时。在左侧dataframe的第23小时，右边的dataframe包含所有的nans。这在每天的新数据中都会被重复。我不知道怎么了？这是我的代码： #w

浏览 4提问于2022-11-09得票数 1

回答已采纳

2回答

熊猫+蟒蛇:按细胞合并2个数据单元

、、、

我有两个pandas.DataFrame： values = pandas.DataFrame([[0, 1], [7,5]], columns=["a", "b"], index=[1, 2]) info = pandas.DataFrame([["foo", "bar"], ["few", "tar"]], columns=["a", "b"], index=[1, 2]) values和info是用户的设置，因此我希望通过合并所有列上的dataframes单元格

浏览 6提问于2016-11-01得票数 2

回答已采纳

1回答

什么时候合并两只熊猫的数据比较明智？

、、、、

假设有两个数据文件共享相同的索引，但是有不同的列。将这两个数据文件合并在这里还是连接在一起更明智呢？ import pandas as pd from pandas import DataFrame df1 = DataFrame(index = ['hey', 'yo'], columns = ['gee', 'thanks'], data = [[1,'foo'],[6,'rhy']]) df2 = DataFrame(index = ['hey', 'yo'

浏览 6提问于2020-03-24得票数 1

回答已采纳

1回答

将可变大小的列表作为列连接到dataframe

、

我想将多个大小的列表从右加入到一个空的dataframe中。代码看起来就像 L1 = [1,2,3,4] L2 = [5,1,7,10,8,2,3] cols = ['L1', 'L2'] df = pd.DataFrame(columns=cols) df = df.join(pd.DataFrame(L1), how="right") df = df.join(pd.DataFrame(L2), how="right") print(df) 但我知道这个错误： df = df.join(pd.DataFrame(L2)

浏览 6提问于2022-06-24得票数 1

回答已采纳

2回答

在多个条件下合并来自多个数据帧的数据

、、、、

我希望合并多个数据格式，但只有在键匹配和日期范围在df1中的“df1”日期范围的90天之内的情况下。我希望保留df1中的所有行，并且只合并来自df2、df3等的额外行，只要它们与键匹配并在日期范围内。注意:首先合并dfs，然后考虑日期范围条件对我不起作用。我首先使用了这种方法，但是合并成功的条件很多，但是由于日期范围超出了限制，所以脚本删除了行。我需要以某种方式保留df1中的所有行。 -这个问题是相似的，但它似乎合并，然后应用这些条件。我认为更好的方法是应用条件，然后在满足条件的情况下合并。不过，我愿意听取你的建议。 DataFrames： a = {'Key': [100

浏览 12提问于2017-12-16得票数 2

回答已采纳

1回答

使用熊猫将多个csv文件连接到一个文件夹中[MemoryError:]

、

我在一个文件夹中有5个csv文件，在这里我想将每个csv文件中的所有列连接到一个dataframe中。当我只加入2个csv文件时，它工作得很好，但是当我想加入5个csv文件时，我遇到了一个错误。我的代码如下： In [7]: import pandas import os import numpy as np import glob path =r'D:/PreprocessingITRC/output/All/' allFiles = glob.glob(path + "/*.csv") dataframe = pandas.DataFrame() for

浏览 4提问于2015-04-20得票数 2

回答已采纳

4回答

转置和连接字符串

、、

如何在不使用for循环的情况下转置和连接pandas数据帧？以下是输入数据： input_data = pandas.DataFrame({'a': ['fruit', 'fruit', 'fruit', 'food', 'food', 'food', 'food'], 'b': ['banana', '', 'apple', 'rice'

浏览 39提问于2019-05-29得票数 3

回答已采纳

1回答

如何通过Pandas DataFrame优化循环

、、

我知道循环遍历Pandas dataframe通常是个坏主意，但在这种情况下，我不知道还能做什么。我有一个名为DataFrame的合并，格式如下，但是有2kk行长。合并时间=合并‘年份’*4+合并‘’qtr‘ year qtr time election_year PostElection 1976 1 7905 NaN 0 1976 2 7906 NaN 0 1976 3 7907 NaN 0 1976 4

浏览 0提问于2020-06-11得票数 0

4回答

熊猫中两个数据帧的合并

、、、

下面有两个数据框架： import pandas as pd data1 = {'date' : ['1', '2','3'], 'value1' : ['a', 'b' ,'c'], 'value2' : ['12','24','4']} data2 = {'date' : ['2','3','4'], &#

浏览 0提问于2019-02-25得票数 2

回答已采纳

1回答

使用modin.pandas合并两个pandas数据帧可以得到ValueError

、、、

为了让我的pandas代码更快，我安装了modin并尝试使用它。之前工作过的两个数据帧的合并给出了以下错误： ValueError: can not merge DataFrame with instance of type <class 'pandas.core.frame.DataFrame'> 以下是两个数据帧的信息： printing event_df.info <class 'pandas.core.frame.DataFrame'> RangeIndex: 1980101 entries, 0 to 1980100 Data

浏览 9提问于2019-11-18得票数 0

1回答

如何在python中基于两种条件进行合并？

、、

我想使用复合ID (car，ID)创建一个连接，如果两个ID在第一个df上都匹配，则使用test列值创建一个新列 # Import pandas library import pandas as pd # initialize list of lists data1 = [['ford', 1010], ['chevy', 1515], ['toyota', 1515]] # Create the pandas DataFrame df_1 = pd.DataFrame(data1, columns = ['Car

浏览 8提问于2021-02-05得票数 0

回答已采纳

1回答

如何组合具有相同列和数据类型的Pandas DataFrames

、、

我有三个数据文件，我需要合并，但我没有任何尝试工作。我一直在尝试每一件事，但都没有效果。到目前为止，这就是我所拥有的： # DataFrame columns columns = ["exchange", "symbol", "name"] # Create NYSE dataFrame NYSE = list(zip(NYSE_symbols, NYSE_companies)) NYSE = [("NYSE", ) + elem for elem in NYSE] NYSE_df = pd.DataFrame([x for x

浏览 9提问于2021-12-01得票数 1

回答已采纳

3回答

在pandas中合并数据帧-继续获取键错误？

、

我正在尝试合并两个数据帧，testr和testc，但我一直在"Channel ID“上得到一个关键错误，并且不确定问题是什么。数据帧是否必须具有相同的大小或具有相同的数据类型才能使pd.merge工作？下面是我在每个数据帧上与.info()合并的代码： def matchID_RC(rev,cost): rc = pd.merge(rev, cost, on='Channel ID', how = 'outer') return rc testr.info() <class 'pandas.core.frame.DataF

浏览 1提问于2015-06-20得票数 2

1回答

熊猫:过关的更好的方式？

、、

我有以下代码，用于交叉连接两个Pandas数据文件。这是最好的方法吗？能否以更快、更有效的方式做到这一点？ # Cross join in Pandas import pandas as pd import numpy as np d1 = {'Year': [2019, 2019, 2019, 2019, 2019, 2019], 'Week': [1, 2, 3, 5, 5, 6], 'Part': ['A', 'A', 'A', 'A', '

浏览 1提问于2020-01-05得票数 1

回答已采纳

1回答

简化Pandas代码以选择时间窗口中的同时出现

、、、

我是编程的初学者。我能够构建下面的东西，它用一个小数据集实现了我想要的东西。随着更大的数据集，我的RAM被淹没，使计算机停止(2014年Macbook Pro有16 my )。我能以某种方式简化我的过程吗？ # This code starts from a co-occurrence list of pairs with dates in the first column, #like this: # # Jan-20; Monkey; Dog # Jan-21; Dog; Horse # Jan-22; Monkey; Cat # Jan-23; Monkey; Dog #

浏览 0提问于2014-06-11得票数 11

1回答

Dask两个conesquent级联导致一个CancelledError

、

在对dataframes使用两次concat之后，我得到了一个意想不到的行为，如下所示： import dask.dataframe as dd import pandas as pd ddf1 = dd.from_pandas(pd.DataFrame({'A': range(10), 'B': [1,3,5,7,9,11,13,15,17,19]}), npartitions=4) ddf2 = dd.from_pandas(pd.DataFrame({'A': range(10), 'B': range(10)}), np

浏览 4提问于2017-03-22得票数 1

回答已采纳

2回答

如何使用concat或merge合并两个数据帧？

、

我正在尝试合并看起来像这样的两个数据框：https://i.imgur.com/ZCPzx7V.png 我应该写些什么来合并这两者呢？我经历过这种情况，但仍然收到错误： https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html https://www.datacamp.com/community/tutorials/joining-dataframes-pandas

浏览 17提问于2020-03-24得票数 0

2回答

合并Pandas中的数据格式会抛出“AssertionError:无法创建BlockManager._ref_locs”

、、

我正在尝试将几个文件从csv导入到单个DataFrame中，并在尝试添加第三个DataFrame时得到以下错误。 AssertionError: cannot create BlockManager._ref_locs because block [ObjectBlock: [CompletionDate, Categories, DateEntered_x, <lots more columns here>...], dtype=object)] does not have _ref_locs set 守则是： project = pandas.read_csv(read_csv

浏览 9提问于2013-08-11得票数 1

回答已采纳

2回答

在可选列或缺少列时，在Python/Pandas中查询数据帧

、、

我正在用Python/Pandas开发一个脚本来比较两个数据格式的内容。这两个数据文件都包含固定列表中列的任何组合，例如： "Case Name", "MAC", "Machine Name", "OS", "Exec Time", "RSS" 某些列的组合被用作唯一的键，但其中一些列可能有时缺少。另外，两个数据文件都包含(和遗漏)相同的列(以避免额外的复杂性)。因此，如果我从另一个dataframe获得一个密钥，那么我想从一个dataframe中检索一个行(我确定该键匹配每个dataframe

浏览 3提问于2021-10-29得票数 1

回答已采纳

1回答

基于“通配符”值的示例行过滤熊猫框架

、

我有一个数据帧和一个过滤器，我想以一个系列的形式应用于这个框架。过滤后的数据应该包括与筛选器匹配的所有行。如果过滤器具有“通配符值”(在本例中定义为NaN )，则所有内容都被视为匹配。下面是这样一个过滤器的实现： df: pandas.DataFrame f: pandas.Series def match(row: pandas.Series, f: pandas.Series): return all([isinstance(value, float) and math.isnan(value) or value == row[idx] for

浏览 5提问于2022-10-27得票数 0

回答已采纳

1回答

熊猫在Python的合并中降低索引？

、

我使用merge(..., how='left')合并两个数据格式，因为我只想保留与“左”数据格式匹配的条目。问题是合并操作似乎删除了我最左边的dataframe的索引，如下所示： import pandas df1 = pandas.DataFrame([{"id": 1, "name": "bob"}, {"id": 10, "name": "

浏览 4提问于2013-03-27得票数 9

2回答

合并后是否有可用的_merge指示符？

、

是否有一种方法可以在合并后在_merge中获得dplyr指示符变量的等效值？类似于Pandas的 indicator = True选项，它本质上告诉您合并是如何进行的(每个数据集有多少匹配，等等)。下面是Pandas中的一个示例 import pandas as pd df1 = pd.DataFrame({'key1' : ['a','b','c'], 'v1' : [1,2,3]}) df2 = pd.DataFrame({'key1' : ['a','b'

浏览 5提问于2016-10-18得票数 13

回答已采纳

1回答

合并数据帧时的KeyError(关键字)

、

Input = df=pd.merge(Bx_Users,BX_ratings,on='user_id') Error = Traceback (most recent call last): File "C:/Users/91943/AppData/Roaming/JetBrains/PyCharmCE2020.2/scratches/MergingwithSummerclothingdataset.py", line 14, in <module> df=pd.merge(Bx_Users,BX_ratings,on='us

浏览 87提问于2020-09-14得票数 0

1回答

在Pandas中合并索引上的数据帧效率更高

、、、

为什么在索引上合并Pandas中的数据帧比在列上合并数据帧更有效(更快)？ import pandas as pd # Dataframes share the ID column df = pd.DataFrame({'ID': [0, 1, 2, 3, 4], 'Job': ['teacher', 'scientist', 'manager', 'teacher', 'nurse']}) df2 = pd.DataFrame({'

浏览 1提问于2018-06-21得票数 18

2回答

如何用Pandas合并两个数据帧？

、、、

我正在使用Pandas合并两个从Psychopy获得的数据帧。 y = ["key_resp_0.keys", "key_resp_0.rt"] #some columns I want in my final dataframe df = pd.DataFrame(myData) columns = df.columns.values.tolist() df2 = df.reindex(columns = y, fill_value='') df3 = pd.merge(df2,df) 这是我得到的错误： type object argume

浏览 0提问于2019-12-03得票数 0

1回答

ValueError:不能将DataFrame与<class 'str'>类型的实例合并

、、

我正在尝试合并两个具有相同列‘值’的数据集，但它给了我一个错误:无法将DataFrame与类型的实例合并 import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import numpy as np from matplotlib.pyplot import pie, axis, show from pandas import Series, DataFrame class Dataset(): def __init__(self, input): self.choice

浏览 0提问于2018-03-10得票数 0

回答已采纳

1回答

熊猫数据，根据其他行的选择进行赋值

、、

我在蟒蛇3里有一只熊猫DataFrame。在这个DataFrame中，有两个列中有相同值的行(这可以是整个部分)，我将将其称为组。列中的每一行都有一个True/False值。现在，对于每一行，我想知道它组中的任何行是否有一个False值，如果有，我希望为另一列中该组中的每一行分配一个False值。我在一个for-循环中成功地做到了这一点，但是它非常慢： import pandas as pd import numpy as np df = pd.DataFrame({'E': [np.nan, np.nan, np.nan, np.nan, np.nan, np.nan,

浏览 0提问于2016-11-28得票数 0

回答已采纳

2回答

带有后缀的pandas中的嵌套合并

、

我正在尝试合并pandas中的多个dataframe，并在生成的dataframe中保持列标签的整齐。下面是我的测试用例： import pandas as pd df1 = pd.DataFrame(data = [[1,1],[3,1],[5,1]], columns = ['key','val']) df2 = pd.DataFrame(data = [[1,2],[3,2],[7,2]], columns = ['key','val']) df3 = pd.DataFrame(data = [[1,3],[2,3],[4,

浏览 10提问于2017-03-11得票数 5

回答已采纳

1回答

Python pandas: merge_asof抛出TypeError：'NoneType‘对象不可调用

、、

pandas merge_asof函数documentation page给出了一个很适合我的例子： left = pd.DataFrame({'a': [1, 5, 10], 'left_val': ['a', 'b', 'c']}) right = pd.DataFrame({'a': [1, 2, 3, 6, 7], 'right_val': [1, 2, 3, 6, 7]}) pd.merge_asof(left, right, on='a') ?

浏览 28提问于2019-05-08得票数 2

1回答

如何在spark sql dataframe中映射一列以创建新列？

、、、

在python和pandas中，我可以创建一个新的专栏，如下所示：使用pandas dataframe中的两列来创建字典。 dict1 = dict(zip(data["id"], data["duration"])) 然后，我可以应用这个字典在第二个dataframe中创建一个新列。 df['id_duration'] = df['id'].map(lambda x: dict1[x] if x in dict1.keys() else -1) 如果我有一个数据帧id_duration (有两列：id和duration)和

浏览 38提问于2021-01-22得票数 0

回答已采纳

1回答

IBM :将ibmdbpy.frame.IdaDataFrame转换为pandas.core.frame.DataFrame

、、、

我对IBM中的ibmdbpy.frame.IdaDataFrame类型有问题。我有两张数据。第一个类型是ibmdbpy.frame.IdaDataFrame，第二个类型是pandas.core.frame.DataFrame。我想在Python中合并这两个数据格式。是否可以将ibmdbpy.frame.IdaDataFrame转换为pandas.core.frame.DataFrame？

浏览 2提问于2017-02-06得票数 2

回答已采纳

1回答

Pandas和lists中的瑞典字符

、

我使用Python2.7和Pandas，对瑞典字符有问题。瑞典字符在Pandas中工作，但是当我从dataframe创建一个列表时，有些地方出错了： import pandas as pd d = {'name': ['Åberg', 'Östlund', 'Älberg', 'Ericsson'], 'age': [22,38,26,35] } df = pd.DataFrame(d) print(df) age name 0 2

浏览 0提问于2017-10-23得票数 2

回答已采纳

1回答

将字典保存到.XLSX中

、、

使用Python + Pandas，是否有一种快速简便的方法将Dict (由键的文件名和值的几列数据组成)保存到.XLSX文件中？经过一些研究之后，我尝试使用以下代码将其转换为Pandas DataFrame (因为我知道您可以使用Pandas DataFrame编写一个.XLSX文件)： import pandas as pd import glob f_list = glob.glob("C:\\Users\\me\\dt\\xx\\*.xlsx") sheets = {f: pd.read_excel(f) for f in f_list} new_df = pd.D

浏览 4提问于2015-10-09得票数 3

2回答

用熊猫在多张桌子上旋转

、、

我想要在多个表上创建一个具有平均值的支点。下面是我想要创建的一个例子:输入是df1和df2，res是我想从df1和df2中计算的结果。 import pandas as pd import numpy as np df1 = pd.DataFrame({"2000": ["A", "A", "B"], "2001": ["A", "B", "B"], "2002": [

浏览 3提问于2022-03-05得票数 0

回答已采纳

1回答

使用iloc从另一个查询数据

有一个具有查找位置和列的dataframe，如下所示： import pandas as pd import numpy as np i = ['dog', 'cat', 'bird', 'donkey'] * 100000 df1 = pd.DataFrame(np.random.randint(1, high=380, size=len(i)), ['cat', 'bird', 'donkey', 'dog'] * 100

浏览 0提问于2019-06-16得票数 2

回答已采纳

1回答

在潘达斯，合并怎么这么快？即使我还没有按索引排序呢？

、、

我正在合并熊猫中的两个数据集，并希望加快这个过程，所以我在用于合并的列中对这两个数据集进行了排序。(以前，这些列根本没有排序。)排序没有造成明显的速度差异，两者都花了大约8秒。如果我手动合并两堆纸，比如说，它们的页码，我会首先按页码对它们进行排序。否则，我将不得不做很多来回翻转之间的堆栈。我写了一个测试来比较这两个过程。它按随机顺序生成两个帧，每个帧有一百万行。然后，它将生成第一列上已排序的另外两个列。然后，它合并前两个，最后，合并后两个。数据生成过程太慢了，以至于我没有时间尝试更多的行--但是合并仍然是在零感知的时间内进行的，即使没有排序。 import pandas as pd im

浏览 0提问于2018-03-20得票数 6

1回答

计算两个数据帧之间的Haversine距离

、、、

我有两个数据帧，df1和df2，每个数据帧都包含纬度和经度数据。对于df1中的每个观测值，我想使用haversine函数来计算df2中每个点之间的距离。我尝试了两种方法，但对于较大的数据集，性能成为一个问题。 In [1]: import pandas as pd import numpy as np from haversine import haversine In [2]: df1 = pd.DataFrame({'lat_long': [(25.99550273, 179.18526021), (76.24387873, -34.219

浏览 0提问于2017-10-03得票数 1

3回答

如何在pandas交叉表上运行join

、、、

我正在尝试创建一个Pandas交叉表，但是我想运行一个join，但它不允许我这样做，因为我认为它是一种特殊类型的DataFrame。请参见下面的示例。 df = pd.DataFrame({'A': ["Alice", "Alice", "Alice", "Bob","Bob","Bob","Charlie"], 'B': ["X","X","Y","X","Y","

浏览 0提问于2020-05-16得票数 2

2回答

如何通过比较列从一个python pandas数据帧中筛选出另一个数据帧中的行？

、、、

我尝试从一个dataframe中排除行，这也出现在另一个dataframe中： import pandas df = pandas.DataFrame({'A': ['Chr1', 'Chr1', 'Chr1','Chr1', 'Chr1', 'Chr1','Chr2','Chr2'], 'B': [10,20,30,40,50,60,15,20]}) errors = pandas.DataFrame({'A':

浏览 2提问于2014-07-10得票数 5