如何合并两个数据帧panda_连接两个panda数据帧_Panda在合并数据帧时遇到问题 - 腾讯云开发者社区

是否有Python函数可以在panda数据帧中查找矩阵索引向量？是否有Python函数可以在panda数据帧中查找矩阵索引向量？是否有Python函数可以在panda数据帧中查找矩阵索引向量？

浏览 13提问于2020-05-09得票数 0

1回答

合并dask数据帧时出现问题

、、

我有几个.pcap文件，我想把它们的数据写到一个大的dask数据帧中。当前，使用第一个文件中的数据初始化dask数据帧。然后，它应该处理其余的pcap文件，并使用合并/连接将其添加到dask数据帧中。但是，当我检查合并的dask数据帧的行数时，它并没有增加。这是怎么回事？我也不确定我是否对我的用例使用了正确的方法。我正在尝试将我的整个数据集转换为一个巨大的dask数据帧，并将其写出到h5文件中。我的计算机没有足够的内存来加载整个数据集，所以我使用dask。我们的想法是加载包含整个数据集的dask数据帧，这样我就可以对整个数据集执行操作。我是dask的新手，我已经阅读了一些文档，但我仍然不清

浏览 16提问于2019-06-02得票数 0

回答已采纳

4回答

databricks:将spark数据帧直接写入excel

有没有办法把spark数据帧直接写成xls/xlsx格式？ web上的大多数示例都显示了panda数据帧的示例。但是我想使用spark dataframe来处理我的数据。有什么想法吗？

浏览 0提问于2019-11-29得票数 5

1回答

使用另一个数据帧填充一个熊猫数据帧最有效的方法是什么？

、、、

我想知道如何才能最有效地执行以下操作，以便还可以将其扩展到具有百万rows+的数据帧。我有两个panda数据帧： Data1： Position Letter 1 a 2 b 3 c 4 b 5 a Data2： Weight Letter 1 a 2 b 3 c 现在我想在数据1中创建一个额外的列(权重)，结果如下： Position Letter Weight 1 a 1

浏览 2提问于2020-09-10得票数 0

1回答

大熊猫中文字与数字的分离

、、、

如果Panda Python中的文本和数字还没有用空格(“")分隔，那么如何区分它呢？在我的数据框架df中，我有一列为0.3314QSF。我想把它分成两个列，分别包含0.3314和QSF，在我的数据帧中有两个不同的列。数据框架由数千行组成，此规则应适用于所有行。谢谢

浏览 3提问于2021-11-26得票数 0

回答已采纳

1回答

将张力板计算图导出为Panda数据帧

、、

需要从Tensorbaord中导出CNN计算图作为Panda数据帧。我查看了，并且只记录了训练信息(因为在训练过程中定义了一个回调函数)。有没有办法将网络架构和权重记录在日志中，然后将其提取为panda数据帧！

浏览 11提问于2021-05-31得票数 0

2回答

将PySpark DataFrame的`numpy`操作转换为Pandas DataFrame的等效操作

、、、

我正在尝试将numpy lambda函数转换为PySpark数据帧的等效函数。我一直在努力寻找正确的函数/方法。我在一个Pandas数据帧上执行以下操作，为panda_stack生成一个新列label panda_stack['label'] = panda_stack.groupby('id')['prob1'].transform(lambda x: 0.0 if all(np.isnan(x)) else 1.0) 基本上，我有： id prob1 id1 NA id1 0.12 id2 NA 并且想要： id label i

浏览 0提问于2018-06-28得票数 1

1回答

Panda dataframe从一行绘制直方图

、

我在panda数据帧中有成行的光谱数据。如何将每行绘制为直方图？我目前使用itterows循环各行，但是我不知道如何使用我的数据绘制直方图？

浏览 1提问于2020-02-19得票数 0

1回答

通过搜索相邻列来选择一列的内容

、、

我有两个不同的熊猫数据框架集。其中之一是术语列表；这些术语是字符串： df_1 apple panda lecture sky green 另一列包含2列，其中一列是包含程序标题的字符串，而第二列包含该程序的标记列表。 df_2 Program Tags Fruits of the World [what,apple,green,banana,kiwi] Animal in the Zoo [panda,lion,eagle] Lecture 1

浏览 0提问于2021-03-18得票数 1

回答已采纳

1回答

如何在pandas中组合两个数据列？

我有两个表，如下所示。我想将两个表合并成1。我尝试在panda中合并、连接、连接，但它给出了一个高度为20的新表，我想在新的组合表中有一个高度为10的表。怎么做这一个熊猫数据帧？

浏览 70提问于2017-10-30得票数 1

回答已采纳

0回答

从包含panda数据帧的列表中去掉零

、、、

我有一个列表0,0,0，数据帧1，0，0，数据帧2，0，0，DataFrame3 其中Dataframe是一个"Panda Dataframe“。现在我要做的是去掉'0‘零(是整数)。有没有办法不使用循环就能做到这一点。我尝试使用set函数，但它不适用于panda Dataframe。我的答案应该类似于这个DateFrame1，DataFrame2，DataFrame3

浏览 1提问于2017-11-27得票数 0

1回答

是否可以在Pandas中构建自己的多变量数据集？

、、、、

我正在努力学习更多关于多变量时间序列预测的知识。我想根据天气数据来预测难民抵达欧洲的情况。到达数据来自不同的来源，天气数据也是如此。有没有办法将这两者结合起来，以便有一个用于多变量时间序列预测的数据集?1个时间序列:每月到达数据2个时间序列:天气数据有没有可能用天气数据和到达数据制作一个数据帧，用于多变量时间序列预测？对于这项任务，我使用panda作为我的主要库，并使用其他一些库进行时间序列分析。通过pandas和numpy实现了该算法。

浏览 6提问于2021-07-05得票数 0

1回答

为什么写入hive表后会有二进制类型

、

我从oracle数据库读取数据到panda dataframe，然后，有一些类型为'object‘的列，然后我将数据帧写入hive table，这些'object’类型被转换为'binary‘类型，谁知道如何解决这个问题？

浏览 2提问于2018-08-16得票数 0

1回答

如何比较两个表中的多列并找出重复的列？

、、

我有两个数据帧数据帧1 ? 数据帧2 ? ID列在两个表中不唯一。我想要比较两个表中除ID之外的所有列，并打印唯一行预期输出 ? 我尝试了“isin”函数，但不起作用。每个数据帧大小为150000，我删除了两个表中的重复项。请建议如何做到这一点？

浏览 20提问于2020-11-03得票数 0

1回答

如何使用字符串常量和number(count)更新pandas列

、、、

我有两个panda列，看起来像这样： Request Number Cost Center 1 111 2 133 3 156 NaN 235 NaN 111 NaN 123 对于NaN (空值)，我如何才能使Pandas数据帧看起来像这样： Request Number Cost C

浏览 5提问于2018-11-01得票数 2

1回答

将pandas数据帧写入csv，但列之间没有空格-在Python 3中忽略sep'\t‘参数

、、

我有一个问题，我在这里找到了许多相关的问题，并阅读了所有的问题，但仍然无法解决。到目前为止，我还没有得到任何答复。我有两个文件，一个是.csv，另一个是.xlsx。它们具有不同的行数和列数。我想根据文件名合并这两个文件。这两个文件非常简单，如下所示； csv文件； excel文件；首先，我将它们转换为panda数据帧； import pandas as pd import csv,xlrd df1 = pd.read_csv('mycsv.csv') df2=pd.read_excel(myexcel.xlsx', sheetname=0) 为

浏览 1提问于2019-01-13得票数 2

1回答

如何在pandas中合并多索引(名称，日期)和列日期，同时保持多索引？

、、

我有两个熊猫数据帧。df1由多个索引(名称、日期)编制索引。df2是一个简单的0到n的索引，有一个'Date‘列。我的问题是如何按日期合并这两个数据帧，同时保持多索引。我使用下面的命令来合并。合并后的数据帧不再具有多索引。 df_merg = pd.merge(df1, df2, how='left', left_on='date', righ_on='Date')

浏览 15提问于2019-09-27得票数 0

1回答

Python DataFrame将两个时间序列数据帧相乘

、

我有两个数据帧。第一数据帧具有一年能量，时间间隔为30分钟。第二个数据帧是30分钟的一天价格数据。如何将两个数据帧相乘，得到第二个数据帧在第一个数据帧的每天重复相乘的结果？非常感谢!

浏览 29提问于2017-08-19得票数 1

回答已采纳

1回答

将第二个参数传递给pool.map中的函数

、、、、

我有一个包含许多行的panda数据帧，我正在使用多处理来并发地处理来自该数据帧的分组表。它工作得很好，但我在传递第二个参数时遇到了问题，我试图将两个参数都作为元组传递，但它不起作用。我的代码如下：我还想将参数"col“传递给函数"process_table”。 for col in cols: tables = df.groupby('test') p = Pool() lines = p.map(process_table, table) p.close() p.join() def process_table(t

浏览 39提问于2019-02-12得票数 0

2回答

Python线性回归输入值

、

我有一个有2列1000行的Excel工作表。我想使用sklearn将其作为我的线性回归拟合命令的输入。/当我想要使用panda创建数据帧时，我如何提供输入？像df_x=pd.dataFrame(...)一样我成功地使用了无数据帧作为： npMatrix=np.matrix(raw_data) X,Y=npMatrix[:,1],npMatrix[:,2] md1=LinearRegression().fit(X,Y) 你能帮助我熊猫如何访问行吗？

浏览 0提问于2017-11-26得票数 0

2回答

列表中的Pandas Dataframe通配符值

、、

如何将数据帧过滤为包含在列表中的值的行？具体地说，数据帧中的值将只是与列表的部分匹配，而不是完全匹配。我尝试过使用pandas.DataFrame.isin，但只有在数据帧中的值与列表中的值相同时才有效。 list = ["123 MAIN STREET", "456 BLUE ROAD", "789 SKY DRIVE"] df = address 0 123 MAIN 1 456 BLUE 2 987 PANDA target_df = df[df["address"].isin(list) 理想情况下，结

浏览 0提问于2019-08-17得票数 2

1回答

按字符向量的分位数过滤

、

我有一个字符向量，我想从其中过滤出第95个分位数。如果使用以下命令，它将更改我的数据帧(即只剩下n和name )。 mydf %>% count(name) %>% filter(n > quantile(n, 0.95)) 如果我使用这个命令，我会得到一个错误。 mydf %>% group_by(name) %>% filter(name > quantile(name, 0.95)) Error in filter_impl(.data, quo) : Evaluation error: non-numeric ar

浏览 5提问于2017-12-31得票数 1

回答已采纳

1回答

在一系列中划分元组

、、

如何划分panda系列： d = {'a': ('a','ball'), 'b': ('b','cat'), 'c': ('c','plane')} ser = pd.Series(data=d, index=['a', 'b', 'c']) ser a (a, ball) b (b, cat) c (c, plane) dtype: object 变成熊猫数据帧，如下所示：

浏览 9提问于2021-09-13得票数 0

回答已采纳

1回答

在pandas中，如何在没有picking_x或_y的情况下合并csv的多个列，而是选择具有该信息的列

、、、

我正在尝试合并两个csv，而不必从_x或_y中选取值。 MetaData1 Sample_name TITLE Cody Chicken Pox Claudia Chicken Pox Alex Chicken Pox Steven Chicken Pox Mom Chicken Pox Dad MetaData2 Sample_name TITLE Geo_Loc DESCRIPTION Dad Chicken Pox Earth people Me

浏览 23提问于2018-01-05得票数 0

0回答

如何修复Python Pandas Dataframes中的浮点差异？

、

我正在将CSV文件读入Panda的数据帧。在检索数据时，我得到的值与原始数据略有不同。我相信这与Python表示小数的方式有关。但是我如何修复它/解决它呢？ CSV数据示例： 1313331280,10.4,0.779 1313334917,10.4,0.316 1313334917,10.4,0.101 1313340309,10.5,0.15 1313340309,10.5,1.8 Pandas数据帧： df = pd.read_csv(csv_file_full_path, names=['time','price', 'volume']

浏览 2提问于2016-07-13得票数 1

回答已采纳

1回答

熊猫合并两个数据帧是否存在已知问题，每个数据帧都有一个日期时间类型的索引

我合并了两个数据帧，每个数据帧都有一个日期时间类型的索引，因此得到的数据帧的行数比原来的多。这两个数据帧具有相同数量的记录，每个和相同的索引值。看一下--我发现同一索引上有重复的记录--这是一个已知的问题吗？守则： df_merged = df1.merge(df2, left_index=True, right_index=True)

浏览 2提问于2022-01-18得票数 0

2回答

我是否应该连接功能和目标数据帧，以便与scikit-learn一起使用？

、

我正在尝试创建一个回归模型来使用设计参数(dataframe 1)来预测可交付成果(dataframe 2)。这两个数据帧都有一个id号，我将其用作索引。是否可以使用两个数据帧为sklearn创建一个数据集？或者我需要加入他们？如果我需要加入他们，那么最好的方式是什么？ # import data df1= pd.read_excel('data.xlsx', sheet_name='Data1',index_col='Unnamed: 0') df2= pd.read_excel('data.xlsx', sheet_nam

浏览 0提问于2021-04-12得票数 0

1回答

Pandas-Python如何从列中提取数据

、

Panda从url接收数据并创建数据表，如何从该数据帧中提取特定列到列表中。具体地说，下面是我的代码，允许panda从url中检索信息。 url="https://pkgstore.datahub.io/core/nasdaq-listings/nasdaq-listed_csv/data/7665719fb51081ba0bd834fde71ce822/nasdaq-listed_csv.csv" req = requests.get(url).content companies = pd.read_csv(io.StringIO(req.decode('utf-8

浏览 17提问于2021-04-28得票数 0

回答已采纳

1回答

将json读取到pandas DataFrame，但pandas追加了上千行

、、

我有一个文本文件，其中的每一行都被清理为json格式。我可以读取每一行，清理它们，并将它们转换为panda数据帧。我的问题是，我想将它们全部添加/组合到一个数据帧中，但有超过200k行。我将其中的每一行都读为'd‘= '{"test1":"test2","data":{"key":{"isin":"test3"},"creationTimeStamp":1541491884194,"signal":0,"hPreds":[0,0,0

浏览 4提问于2018-11-19得票数 2

3回答

Python Pandas -合并条件

、、、、

我在python pandas中有两个数据帧数据帧1 User_id zipcode 1 12345 2 23456 3 34567 数据帧2 ZipCodeLowerBound ZipCodeUpperBound Region 10000 19999 1 20000 29999 2 30000 39999 3 如何使用pandas merge将区域中的数据映射到条件为if(df1.zipcod

浏览 3提问于2016-10-29得票数 3

1回答

带条件的数据透视表

、

我想写一个代码来创建一个新的数据帧基于这个旧的数据帧使用panda。 ] 在图像中，如果字段“Address Line 1”出现多次，则将整行复制到新的数据帧中。如果“地址行1”字段为空，或仅出现一次，请不要复制。注意:具有相同“地址行1”的多个行条目可能不会彼此相邻。

浏览 2提问于2018-10-18得票数 0

1回答

Python合并两个DataFrames仅检索结果中的特定列

、、、

? 您好-我想合并两个python DataFrames，但不想将这两个数据帧中的所有列都带到我的新数据帧中。在下图中，如果我在“acct”上加入df1和df2，并希望从df1中取回所有列，而从df2中仅取回“entity”，我该如何编写？我不想丢弃任何列，所以做一个普通的合并不是我想要的。有人能帮上忙吗？谢谢!

浏览 32提问于2020-12-10得票数 0

回答已采纳

1回答

以x值为指标的pandas Dataframe线性回归

、、

我有一个数据帧df [250 rows x 120 columns] 0 1 2 3 4 5 \ lag time [s] 0.041667 0.038638 0.193427 0.126253 0.058737 0.122129 0.117425 0.083333 0.104397 0.323418 0.3

浏览 6提问于2014-01-30得票数 2

1回答

不带重复项的Pandas外连接添加新行

、、、

我有两个数据帧preds和assets_to_remove。下面是dataframe preds的外观： asset_id asset_name 294771 493646671302244 queue_bar 294770 503848157271852 refactor_target 294769 786314528522899 submission_tray 294768 206472013793428 state_subscriber 294767 510707746509671 for

浏览 23提问于2021-07-07得票数 1

回答已采纳

1回答

使用pandas更改excel单元格的颜色

、、、、

我正在使用panda lib来获取excel文件的数据帧。我想更改背景颜色并将其另存为excel文件。我该怎么做呢？我尝试使用样式器，但它要求我导入Jinja2。我使用eclipse IDE和公司的计算机。如何提前解决it.thanks问题

浏览 31提问于2020-04-09得票数 0

回答已采纳

1回答

如何在pandas中执行多列的内连接

、

我有2个数据帧，即accidents_data，它有15列，bad_air_quality_data数据帧，它有5列。现在我想在列‘地区名称’，‘工作日’，‘小时’，‘月’上对两个数据框进行内部连接，最后在连接后只保留来自accidents_data的数据。 accidents_data： bad_air_quality_data：我尝试使用以下行合并这两个数据帧，但没有显示任何结果。 accidents_data_bad_air = pd.merge(accidents_data, bad_air_quality_data, on=['District Nam

浏览 3提问于2019-03-08得票数 0

1回答

在Spyder 4.0中安装pandasql或sqltopandas

、、、、

Spyder 4.0或Jupyter指出，我正在尝试在panda数据帧上使用SQL命令，但在从命令行安装任何类型的包时遇到了问题。

浏览 2提问于2020-08-09得票数 0

1回答

按索引为对象及其labelencoders合并两个df

、

我有两个数据帧。 df1的列为['City','State','Zip'] df2具有与df1相同列的标签编码器。这里的每个索引都是每列的编码标签。我想按索引合并/合并这些数据帧。如何确定哪个标签属于什么，以及如何将它们放到单个数据帧中，其中前三列将是原始列，其索引['City','State','Zip']，接下来的三列将是它们受尊重的标签['City_encoded','State_Encoded','Zip_Encoded']

浏览 21提问于2020-08-27得票数 0

2回答

拒绝在帧中显示，因为它将“X帧选项”设置为“SAMEORIGIN”。在safari浏览器中的熊猫文档

、、

我在文档中使用panda doc进行电子签名，但是当我在panda doc编辑器中打开文档时，会出现以下错误：错误拒绝在帧中显示“”，因为它将“X帧选项”设置为“SAMEORIGIN”。此错误仅在Safari浏览器中发生。有人能纠正这个错误吗？

浏览 2提问于2022-02-16得票数 0

1回答

在Python中使用Panda Dataframes Date正在转换为时间戳

、

我在python中使用panda dataframe在MySQL/MariaDB数据库中读取和存储数据时遇到了一些错误。我尝试以YYYY-MM-DD的形式将计算出的日期存储到数据帧中。我将它输入到一个数据帧中，但由于某种原因，它被转换为格式为"YYYY-MM-DD HH:MM:SS“的时间戳。我不会显示完整的代码，但只显示与此日期错误有关的部分，因为我已经确认其他变量正在正确传递。 for j in range(0, final_day): DateW = DateP + dt.timedelta(days = j + int(First_day)) DateWCo

浏览 38提问于2018-07-17得票数 0

回答已采纳

1回答

Python 2.7 groupby，然后加入

、、、

我的问题是如何连接两个数据帧，这两个数据帧是由groupby方法以及sum()和max()函数创建的。情况是:我有第一个数据帧和下一个结构：第二个具有相同的结构，但不是DepartmentDescripton...变量，我有“星期一”，“星期二”等等。然后我试着加入他们： train_joined_dep_week = pd.merge(tr_bin_dep_grouped, tr_bin_weekday_grouped_flag, left_on=["VisitNumber"], right_on=["VisitNumber"], how=&#

浏览 0提问于2015-11-21得票数 0

2回答

如何在Python中的PANDA数据中插入行？

如何在Python中的PANDA数据中插入行？我目前正在从一个查询示例data = pd.read_sql_query (query, con)加载数据，该数据具有以下结构： timestamp data1 data2 1515581720 12 23 1515581721 23 34 1515581723 45 34 1515581724 45 23 我想知道，是否可以在Panda库的dataframe中插入从mysql获得的信息的新行。在前一种情况下，注册"1515581722“丢失，应该是： timestamp data1 data2 1515581720 12 23 1515

浏览 2提问于2018-01-10得票数 0

2回答

在Pandas中创建DateTimeIndex

、、

我第一次使用panda遇到了困难我有一个包含年、月、日和小时的数据帧，它们分别位于不同的列中。据我所知，这个数据帧没有索引。我正在尝试创建此数据帧的datetime索引： def createTimeStamp(year, month, day, hour): return DatetimeIndex(datetime(.........)) df['TimeStamp'] = df.apply(createTimeStamp(df['year'], df['month'], df['day'], df['

浏览 3提问于2016-04-09得票数 3

回答已采纳

1回答

根据条件筛选行，并使用python pandas从数据帧中选择多列。

、

如果我有下面的数据框子集 A B C D E Date R0 xy 78 io 16 73 2021-03-25 R1 xx 27 ya 80 1 2021-04-20 R2 xx 53 ya 27 44 2021-06-20 R3 xx 65 io 30 84 2021-08-22 R4 xv 9 ui 62 1 2021-08-01 我该如何处理panda才能拥有以下数据帧： A B C Date R1 xx 27 ya

浏览 29提问于2021-03-27得票数 1

1回答

使用R-比较数据帧的不同列和一组有效的列组合

、

我使用带有RVersion3.2.2的RV3.2.2，并希望在数据帧中筛选行，其中只希望看到那些行，其中两个列的值组合与第二个数据帧中的有效组合存储值对不匹配。我听说R不是设计成以一种高效的方式使用循环的，所以我在寻找一个不使用循环的解决方案，如果有循环的话。使用我缩小的这个示例数据，第一个数据帧dfItem包含项ID和两个状态。 > dfItem ID Status_1 Status_2 1 1 1 1 2 2 1 2 3 3 2 1 4 4 3 3 5 5

浏览 1提问于2016-01-27得票数 1

回答已采纳

2回答

更新Pandas数据帧中的值似乎更新了所有数据帧

、、

我已经构建了两个这样的Pandas数据帧： import panda as pd d = {'FIPS' : pd.Series(['01001', '01002']), 'count' : pd.Series([3, 4])} df1 = pd.DataFrame(d) df2 = df1 我想要更改df2中的一个值。这是我尝试过的： df2.loc[df2['FIPS'] == '01001','FIPS'] = '01003' 这一行似乎同时更新了df1和d

浏览 1提问于2017-02-05得票数 0

3回答

如何更改代码，使输出中的值只显示一次，而不是使用随机数多次显示？

、

我需要找到与我在下面显示的两个panda系列中相同的数据，并将它们放入列表中，但列表中的一些输出显示了不止一次。如何更改代码，使输出只显示一次？这是我的2个panda系列的代码： N= 10 data1 = [] for i in range(N): data1.append(random.randint(1,10)) s1 = pd.Series(data1) print('Panda Series 1:') print(s1) print() # Creating the second panda series, s2 data2 = [] for i in rang

浏览 0提问于2021-02-24得票数 0

1回答

在R中合并会产生比其中一个数据框更多的行

、、、

我有两个数据帧，第一个包含9994行，第二个包含60431行。我想合并两个数据帧，以便合并后的数据帧包含两个数据帧的组合列，但只包含9994行。然而，我在合并时得到了超过9994行。我如何确保这种情况不会发生？ df1 = readRDS('data1.RDS') nrow(df1) # [1] 9994 df2 = readRDS('data2.RDS') nrow(df2) # [1] 60431 df = merge(df1,df2,by=c("col1","col2")) nrow(df) # [1] 10057

浏览 2提问于2015-05-23得票数 7

3回答

如何合并某些行值相等的两个数据帧？

、、、

我有两个数据帧，我想把它们合并成一个。第一个文件具有ID作为其列，而第二个文件具有相同的值，但在名为id_number的列中。我尝试了下面的代码，但最终final_df同时具有ID和id_number列及其值。如何在合并后只保留一列I？ final_df = df.merge( df2, left_on='ID', right_on='id_number', how='inner') 另外，让我们假设df列A的数据帧格式如下： A 0 1 2 第二个dataframe中的同一列A有一些空字段，如下所示： A -

浏览 15提问于2021-06-22得票数 0

1回答

Python -如何根据DF和其中的数据制作SQL "Create Table“语句？

、、

我将数据(从CSV或Excel)加载到Python的Panda DF中。 import pandas as pd df = pd.read_csv('table1.csv') 数据如下所示： c1,c2,c3 1,abc,1.5 2,bcd,2.53 3,agf,3.571 如何使SQL create table statement基于数据帧中的数据，在此示例中为： create table table1 (c1 int, c2 varchar(3), c3 float); 谢谢。

浏览 11提问于2018-07-29得票数 0