合并列名相同、行数不同的多个DataFrames_从多个DataFrames中查找不同的列名_清除多个DataFrames的列名 - 腾讯云开发者社区

python、pandas

我有两个数据序列，我试图使用每一行数据中的值来生成Pearson相关系数。我目前正在使用代码生成一个具有相关值的新数据帧： Corr_df = df_A.corrwith(df_B, axis = 1) 但是，得到的Corr_df只返回空值。当我可以使用CORREL公式在excel中生成相同的相关系数时，Python为什么不这样做呢？指向df_A的链接是：指向df_B的链接是：请帮帮我！

浏览 0提问于2018-04-02得票数 0

回答已采纳

1回答

如果两个dataframe列的值匹配，就将dataframe列的值分配给另一个dataframe的值。

python、pandas、dataframe

我有两个数据文件(它们没有相同的行数) dfA包含两列"CCLE_ID“和"Name”，以及其他不重要的列。 dfB包含两列"CCLE“和"Cell”以及其他不重要的列。现在，dfB‘’CCLE‘值被设置为0。我要做的是比较dfA['Name']列和dfB['Cell line']列中的所有值。它们都是字符串，代表细胞株的简称。如果dfA['Name']和dfB['Cell line']列的值匹配，那么我希望用匹配单元名称的dfA['CCLE_ID']列中的字符串替换dfB[&#

浏览 5提问于2022-01-24得票数 0

1回答

Python搜索和附加2个csv文件

python、csv、data-cleaning

我有两个CSV文件。第一个文件有美国所有州的列表，但在经度和纬度列中缺少值。我找到了另一个CSV文件，它包含美国所有州的所有经度和纬度值。我现在要做的是循环遍历第一个文件上的'Location‘列，将它与第二个文件上的'Location’列匹配，然后得到它的经度和纬度的相应值。之后，我需要将这些值附加到第一个文件中的经度和纬度列中现在，我要说的是： aviationdata = pd.read_csv('AviationData.csv', sep = ',', header = 0, encoding = 'iso-8859-1&#

浏览 1提问于2020-03-14得票数 0

回答已采纳

1回答

熊猫合并TypeError:类型为'NoneType‘的对象没有len()

python、pandas

我正在实验熊猫合并left_on和right_on params。根据和文档1: left_on和right_on是左/右DataFrame中要加入的字段名的状态。文档2:左DataFrame中的列用作键键是什么意思？下列文件1： left_frame = pd.DataFrame({'key': range(5), 'left_value': ['a', 'b', 'c', 'd', 'e']}) right_frame = pd

浏览 1提问于2018-01-02得票数 11

回答已采纳

1回答

如何在R中使用While循环读取相应相关的标题的名称

r、correlation

我有两个关于人口饮食习惯的excel档案，文件A(1997年)和B(2000年)。我把它们导入R.文件A有35个标题，每个标题都有200个数据。文件B有35个标题，每个标题都有200个数据。我如何做一个while循环来关联：标题1从文件A，标题1从文件B，等等？标题是以字母表示的，所以我想也许我可以使用ncol，方法是让计算机使用文件A中的第1列与文件B中的第1列相关联。任何建议都是有帮助的！谢谢!

浏览 1提问于2018-03-29得票数 2

回答已采纳

1回答

在迭代多个列后按顺序获取列

python、csv、pandas、ipython

您好，我已经迭代了多个列，并且它起作用了。但所有CSV文件中的列名顺序如下： Output: id title content tags 但是，我的代码按以下顺序输出列： Output : content id tags title 如何将其恢复为所有csv文件的顺序下面是我的代码： import glob import os import pandas as pd pd.set_option("display.max_rows", 999) pd.set_option('max_colwidth',100) import numpy as

浏览 9提问于2017-01-24得票数 0

回答已采纳

2回答

朱莉娅DataFrame第一行数据被用作列名。

csv、dataframe、julia

我有没有头的csv文件： 20150409，15.47，15.77，15.07，15.15,31116 因此，当我用文件创建数据帧时，第一行数据就会变成数据帧的列名。我想知道如何为已经存在的列(日期、关闭、高、低、打开、卷)创建带有名称的数据框架，或者至少如何插入新的名称行，并在创建数据帧之后将数据插入数据帧的正文中。感谢任何能帮忙的人！解决方案谢谢伊斯梅尔，我最后用的是： df = readtable(file,names= [symbol("date"),symbol("close"), symbol("high")

浏览 0提问于2015-12-20得票数 4

回答已采纳

1回答

是什么导致这个panda.concat行为怪异？

python、pandas、csv

关于这就是任务的一些背景:我在过去的一周里根据这个日期给了我一系列的csv文件，这给了我newData.csv文件。我需要将其附加到存储在oldData.xlsx中的以前的数据中，以便它位于旧数据的下方。生成newData的代码 df1 = pd.read_csv(fName0) #subtracted_date = pd.to_datetime(openDate) - timedelta(days=8) #subtracted_date = subtracted_date.strftime("%d/%m/%Y") Previous_Date = d

浏览 4提问于2022-06-01得票数 0

回答已采纳

1回答

如何将“假日”列合并到我的主数据中，我似乎得到了一个KeyError

python、pandas、dataframe、data-science、eda

DataFrames 每当我尝试运行这个程序时，我都会继续获取KeyError masterdata = cabdata.merge(transaction, on= 'Transaction ID').merge(customer, on ='Customer ID').merge(city, on = 'City').merge(holidaydata, on='Holidays') 错误： KeyError Traceback (most recent ca

浏览 7提问于2022-06-12得票数 0

1回答

如何根据另一个数据帧中的值对数据帧中的值进行零设置

python、pandas

假设我有两个大小相同的数据，一个具有值： d1 = {'values1': [1, 1,2,2], 'values2': [10, 50,200,100]} df1 = pd.DataFrame(data=d1) 以及一份布尔人的数据： d2 = {'boolean1': [True, False,True,True], 'boolean2': [False, False,False,True]} df2 = pd.DataFrame(data=d2) 如何将df1中的值替换为0(布尔人为True ) 我正在寻找的结果是： r =

浏览 3提问于2022-11-15得票数 1

1回答

Python:如何连接两个数据文件，其中一个有重复的密钥

python-3.x、pandas

我正在尝试连接两个数据文件，一个有Id和电话号码，另一个在同一个Id字段中有很多其他列(但是这个DF中有一些重复的Id)。我如何加入电话号码列从第一个数据到第二个？我试过这样做，但是我得到了重复的键错误： df= df.join(other.set_index('Id'), on='Id', how='outer') 我怎样才能做到这一点？(我希望第二个DF中的重复ID与非重复的电话号码相同)

浏览 1提问于2019-10-25得票数 0

回答已采纳

1回答

在缺少列时中断vcat上的更改

julia

朱莉娅·0.5的时候，我习惯了这样做： A = DataFrame(ID = [20,40], Name = ["John Doe", "Jane Doe"]) B = DataFrame(ID = [60,80], Job = ["Sailor", "Sommelier"]) C = DataFrame(Year = [1978, 1982], Test = ["Something", "Somewhere"]) vcat(A,B,C) 现在，我试图在v0.6.4中复制相同的内容，但是我

浏览 1提问于2018-07-26得票数 1

回答已采纳

2回答

检查两只熊猫的数据是否已经合并

python-2.7、pandas、merge

假设我有DataFrames、df和df2。df2可能已经或者可能还没有与df合并 df = df.merge(df2,how='left',left_index=True,right_index=True) 当未合并时，它们应该没有共同的列名。检查df和df2是否已经合并的最干净的方法是什么？

浏览 0提问于2018-04-24得票数 0

回答已采纳

1回答

如何在合并多个文件时修复pandas合并函数错误

python、pandas

我有几个用制表符分隔的文件，前2列相同。我正在尝试使用pandas合并功能合并这些文件。我用glob和read_csv函数把所有的文件做了一个数据帧。一切看起来都很好直到这里。pandas合并函数抛出错误如下。pd concat运行良好，但这不是我想要的，因为它在当前文件下添加新文件。请帮我找一下用法。 path = r'/data/tim/home/*' file = glob.glob(path + "/sale.txt") df = (pd.read_csv(i,delimiter='\t') for i in files)

浏览 0提问于2019-08-01得票数 0

1回答

合并R中具有不同列名的数据框

我有3个具有相同数量的列的数据框，我想将它们绑定在一起(将它们按列绑定在一起)。问题是这些数据帧来自不同的来源，其中一些列略有不同，例如: df1-列A-美元金额，df2-列A-美元金额(USD)，R不知道它们是相同的。我试过这个： colnames(df1)=colnames(df2) 它起作用了，但问题是，当我尝试导出合并的文件时，每次列的名称都不同--有时是“美元金额”，有时是“美元金额(USD)”。有没有什么可以自动完成的？我在这个数据框中有40多列。谢谢！！

浏览 1提问于2021-04-13得票数 1

3回答

多只熊猫数据的交集

python、pandas、dataframe、merge、concatenation

我在一个列表中有一些数据(100)，如下所示： frameList = [df1,df2,..,df100] 每个dataframe都有两个列DateTime，Temperature。我希望在普通的DateTime列上交叉所有的数据，并将它们的所有Temperature列组合/合并成一个大数据:来自df1的温度、来自df2的温度、来自df3的温度、来自df100的温度。 (熊猫merge不工作，因为我需要计算多个(99)个成对的交叉口)。

浏览 2提问于2016-11-10得票数 6

回答已采纳

1回答

如何在没有索引的情况下将Python字典保存到csv文件？

python、csv、dictionary

我将3个DataFrame存储在一个名为dict的字典中，我想将所有的数据存储在这样的csv文件中， dict Key Type Size Value 001 DataFrame (3,4) Columns names: date, count, number, expiration 002 DateFrame (3,4) Columns names: date, count, number, expiration 003 DateFrame (3,4)

浏览 1提问于2017-03-19得票数 0

回答已采纳

1回答

两种不同数据帧的两列的海图

python、pandas、plot、seaborn

有两个不同的数据帧具有相同的列名，我想使用下面的语句用Seaborn绘制图。但是，我收到一个错误： 'list‘对象没有属性'get’。 sns.JointGrid(data=[df_1, df_2] , x=df_1['ABC'], y=df_f2['ABC'], xlim=(140, 190), ylim=(40, 100), height=5)

浏览 2提问于2020-12-11得票数 0

回答已采纳

1回答

熊猫:关于如何设计数据和附加多个csv文件的想法

pandas、dataframe、csv、append、glob

你好，我对熊猫很陌生，我有一组非常不方便的csv数据，如： PMSN01001_PFT0_20181212_Crop_AGE.jpg_OCR.csv PMSN01001_PFT0_20181212_Crop_GENDER.jpg_OCR.csv PMSN01001_PFT0_20181212_Crop_HEIGHT.jpg_OCR.csv PMSN01001_PFT0_20181212_Crop_WEIGHT.jpg_OCR.csv ... PMSN01002_PFT0_20181212_Crop_AGE.jpg_OCR.csv PMSN01002_PFT0_20181212_Crop_GE

浏览 2提问于2021-03-02得票数 0

回答已采纳

3回答

确定pandas中的多个数据框是否具有相同的列名

python、pandas

我有几个df，我想确定它们是否都有相同的列名。我见过几个例子，其中这是用两个数据帧完成的，但我想要一些关于如何跨多个df-s执行此操作的信息。例如，如果我有一个df-s列表 dataframes = [df_1, df_2, df_3, df_4, df_5_1, df_5_2, df_6_1, df_6_2] 我可能会遍历每个列，看看它们是否都包含相同的列名。

浏览 0提问于2019-12-05得票数 2

1回答

为什么dask使用from_pandas比直接使用Dask读取数据更快地计算数据？

python、python-3.x、pandas、dask、dask-distributed

我在dask中以不同的方式运行了相同的数据集。我发现一条路比另一条快10倍！我试着找出没有成功的原因。 1.完全是达斯克 import dask.dataframe as dd from multiprocessing import cpu_count #Count the number of cores cores = cpu_count() #read and part the dataframes by the number of cores english = dd.read_csv('/home/alberto/Escritorio/pycharm/NLP/ignore_

浏览 1提问于2019-12-06得票数 0

回答已采纳

1回答

实时变化的图和pandas数据帧

python、pandas、dataframe、matplotlib、graph

我有一个2000行的dataframe (df)。 from close min max 0 1607403960 1.21145 1.21145 1.21145 1 1607404020 1.21145 1.21149 1.21145 2 1607404080 1.21149 1.21155 1.21149 3 1607404140 1.21155 1.21154 1.21154 4 1607404200 1.21154 1.21154 1.21153 ...

浏览 13提问于2020-12-09得票数 0

1回答

重命名的区别！在朱莉娅里用新的DataFrame重命名？

dataframe、rename、julia

rename和rename!在朱莉娅建造新的DataFrame时有什么区别吗？通常，我认为修改现有的DataFrame rename!是理想的，因为它修改参数而不生成内存中的新对象。但是由于内存中不存在对象，所以rename似乎是合适的。 using DataFrames df1 = rename( DataFrame(rand((100,2))), [:x1, :x2], [:x, :y]) df2 = rename!(DataFrame(rand((100,2))), [:x1, :x2], [:x, :y]) # Ideal formulation not using rename

浏览 0提问于2017-04-07得票数 3

回答已采纳

1回答

熊猫在列索引或命名栏上合并而不知道有多少

python、pandas

我不知道如何解决我的问题。我想合并两个数据文件： show = pd.merge(df1, df2, how='left', on=0) 但是，由于每次调用函数时，这两个数据格式都有很大的变化，所以我不知道有多少列，所以我无法命名它们。合并函数需要列名才能工作。我试着只提供列号，但没有起作用： raise KeyError(key) KeyError: '0' 是否可以不使用列名来合并数据文件。或者--我是否可以在不知道有多少列的情况下命名列呢？ @jezrael仍然显示一个错误： Traceback (most recent call last): Fil

浏览 4提问于2021-03-10得票数 0

回答已采纳

3回答

如何在中合并两个数据帧？

pandas

我有两个数据框架( df1和df2 )，我想将它们合并成一个数据框架。这就好像df1和df2是通过将单个数据帧垂直地沿着中心分割而创建的，就像撕掉一张包含列表的纸张，使一半的列在一张纸上，一半的列在另一张纸上。我想把它们合并起来。我该怎么做呢？

浏览 0提问于2016-03-19得票数 14

1回答

合并多个jacoco.exec文件是否会减少合并文件的大小并提供不同的代码覆盖率？

jacoco

我有三个jacoco.exec文件。我能够合并这些文件，并将其输出为merged.exec文件。但是我的merged.exec文件比合并的文件大小要小。例如：我的文件大小： 1st jacoco.exec = 1789 KB = Code Coverage = 4% 2nd jacoco.exec = 925 KB = Code Coverage = 3% 3rd jacoco.exec = 510 KB = Code Coverage = 4% ------------------------- Merged.exec = 625 KB = Code Coverage = 5% =

浏览 6提问于2017-04-24得票数 1

1回答

从多个页面中抓取一个表，并将其存储在一个数据文件中

python、pandas、beautifulsoup

Problem：一个网站有c.80页，每个页面都包含一个结构相同的表。我需要刮每一张桌子，并将结果存储在一只熊猫的数据中。表内容定期更新，因此需要经常重复。我可以从一个页面中抓取表，但我很难在多个页面中完成它。我发现的所有示例都用于迭代更改的URL，例如(www.example.com/page1 1、/page2等)，而不是用于指定的URL列表。我尝试了下面的URL子集(理想情况下，我希望从csv列表中读取URL)，但它似乎只将最后一个表刮到dataframe (即ZZ)中。很抱歉，如果这看起来不太好，我对Python相当陌生，我主要使用pandas进行数据分析，直接从csv读取。任何

浏览 0提问于2018-11-13得票数 1

回答已采纳

1回答

合并2个MySQL数据库

mysql、database、merge

我有一个问题，我需要把两个数据库合并成一个数据库。问题是有相同的表，但每个表有不同的字段。示例：应将DB1合并到DB2 DB1表: xyz字段: id、field1、field2等 DB2表: abc字段: id、field1、field3等如果我尝试将SQL从DB1插入到DB2中，就会出现类似"Column field2 not found“这样的错误。有没有工具可以帮我合并这些数据库？我在MySQL工作台上试过了，没有成功。谢谢你的帮助。问候Chris

浏览 2提问于2015-06-08得票数 0

1回答

执行ldply时as.POSIXct.numeric错误

r、plyr

我有一个包含3个数据帧的列表"list.of.df“，它强制进入一个包含所有数据帧的列的单一数据帧，使用来自plyr包的ldply。 df <- ldply(list.of.df) 这种方法过去是可行的，但是今天我有了一组新的数据，并且收到了一个错误。 As.POSIXct.numeric中的错误(什么，tz = tzone)：必须提供“原产地” 在3个数据帧中有几个POSIXct变量，所以每次我有一组新的数据时手动排除故障可能有点麻烦。相反，是否有一种方法可以让我传递ldply调用中所需的ldply？列表可以从dropbox链接load 编辑。

浏览 2提问于2015-07-09得票数 0

回答已采纳

2回答

pandas concat生成NaN值

python、pandas、dataframe、concatenation、nan

我很好奇为什么pandas中两个数据帧的简单连接： shape: (66441, 1) dtypes: prediction int64 dtype: object isnull().sum(): prediction 0 dtype: int64 shape: (66441, 1) CUSTOMER_ID int64 dtype: object isnull().sum() CUSTOMER_ID 0 dtype: int64 具有相同形状且都没有NaN值的 foo = pd.concat([initId, ypred], join='outer',

浏览 5提问于2016-10-31得票数 61

回答已采纳

1回答

python/pandas在加载csv文件时“内核已死，正在重新启动”

python、pandas、kernel

当尝试加载一个大的csv文件(150MB)时，我得到错误“内核死了，正在重新启动”。那么我使用的代码如下所示： import pandas as pd from pprint import pprint from pathlib import Path from datetime import date import numpy as np import matplotlib.pyplot as plt basedaily = pd.read_csv('combined_csv.csv') 以前它是有效的，但我不知道为什么它不再工作了。我尝试使用engine="pyt

浏览 0提问于2020-01-11得票数 1

1回答

Python在保持行数的同时合并(只添加列)

python、pandas

如何在保持行数的同时合并2个DF？日期是唯一的主键，事实上，这两个数据文件是从同一个父数据文件中过滤出来的。 df_afs = df[df['Filesystem'].str.contains(".snapshot") == False] df_sfs = df[df['Filesystem'].str.contains(".snapshot") == True] df_all = pd.merge(df_afs, df_sfs[['date', 'sfs_volume',&

浏览 2提问于2020-04-09得票数 1

回答已采纳

1回答

pd.read_excel("file.xlsx")不是创建'DataFrame‘，而是创建'OrderedDict’

python、excel、python-3.x、pandas

我目前正在从事一个利用熊猫进行数据科学研究的项目。我和Spyder一起当IDE。然而，在安装和测试了VSCode之后，我的代码遇到了问题，因为熊猫似乎不像以前那样工作了。我正在从一个DataFrame文件中创建一个，目前只使用其中的一个示例(用于测试目的)。 import pandas as pd data = pd.read_excel("Input.xlsx", sheet_name=None) sample = data.sample(n=20, random_state=1).reset_index() 但是，我的数据变量现在是'OrderedDict‘类型

浏览 0提问于2019-01-24得票数 3

回答已采纳

1回答

Python:如何将多个Excel工作表读入列表？

python、python-3.x

在Excel中，如何将“Sheet1”和“Sheet2”解析为list？我目前正在使用xlrd，如下面的代码所示。 Sheet1： Sheet2：我的代码： #!/usr/bin/env python2 # -*- coding: utf-8 -*- from __future__ import print_function import xlrd import sys loc = 'excel.xlsx' wb = xlrd.open_workbook(loc, encoding_override="iso-8859-5, cyrillic&#

浏览 2提问于2020-11-30得票数 1

回答已采纳

5回答

把熊猫的资料连在一起

python、pandas、dataframe、concat

我有一个Pandas数据格式的列表，我想将它合并成一个Pandas dataframe。我正在使用Python2.7.10和Pandas 0.16.2 我创建了数据文件列表，该列表来自： import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall , cnxn, chunksize=10000): dfs.append(chunk) 这将返回数据格式的列表。 type(dfs[0]) Out[6]: pandas.core.fra

浏览 8提问于2015-09-07得票数 250

回答已采纳

2回答

postgresql中的增量列

sql、postgresql

我在Postgresql中有一个带有序列Id的表。我创建了另一个表序列号。现在我想合并这两个表。因此，我想从第一个表的最后一个序列Id开始更改第二个表的序列Id。假设第一个表的序列Id为126799。所以第二个表的序列号应该从126800开始。我已经处理了我的第二个表。我只想更改序列号。请提个建议。

浏览 1提问于2020-09-17得票数 0

2回答

理解大熊猫合并的本质

python、pandas

我想了解pd.merge的工作性质。我有两个长度不等的数据流。当试图通过以下命令合并它们时 merged = pd.merge(surgical, comps[comps_ls+['mrn','Admission']], on=['mrn','Admission'], how='left') 长度与预期的不同如下 length of comps: 4829 length of surgical: 7939 length of merged: 9531 根据我自己的理解，merged dataframe应该具有与co

浏览 4提问于2021-01-23得票数 0

回答已采纳

1回答

为什么我的数据除了第一列以外都转换成了NaN？

python-3.x、stocks

我尝试过各种不同的代码，包括尝试reset_index()，因为可能有一个多索引导致了错误。如果你看到下面的打印输出，你会注意到'Symbol‘索引。我不确定如何删除它，以及这是否可以修复错误。 tickers = ['AAPL', 'BAC'] prices_list = [] for ticker in tickers: try: prices = dr.DataReader(ticker,'morningstar','01/01/2017')['

浏览 4提问于2018-02-16得票数 0

2回答

蓝色绿色部署与库伯奈特斯数据库-数据丢失？

database、kubernetes、database-migration

我是，它非常清楚和详细地解释了这个过程是如何工作的：使用新版本部署新容器，同时仍将流量引导到旧容器迁移数据库更改，并让服务指向新的数据库将流量重定向到新容器，并在没有问题时移除旧容器我有一些问题，特别是关于我们从旧数据库切换到新数据库的那一刻。在本文的第3步中，我们有person-v1和person-v2服务，它们仍然指向数据库的未修改版本(postgres v1)：从图中看，可能需要有person-v2指向数据库才能建立TCP连接，但由于代码和DB模式之间的不兼容性，它可能会失败。但是，由于所有传入的流量仍然指向person-v1，这不是一个问题。

浏览 2提问于2021-05-22得票数 1

回答已采纳

1回答

通过使用python匹配国家名称的子字符串来更新数据框中country name列中的空值

python、python-2.7、pandas

我有两个数据帧: Disaster，CountryInfo Disaster有一列国家代码，其中有一些空值，例如：灾难： 1.**Country** - **Country_code** 2.India - Null 3.Afghanistan (the) - AFD 4.India - IND 5.United States of America - Null CountryInfo： 0.**CountryName** - **ISO**

浏览 15提问于2016-09-26得票数 0

1回答

使用python中的熊猫合并具有相同“列名”和“不同行”的两个文件的一种方法

python、csv、pandas、merge

我有两个数据文件a.csv和b.csv，它们可以从pastebin获得：第一个文件a.csv有4列和一些注释： # coating file for detector A/R # column 1 is the angle of incidence (degrees) # column 2 is the wavelength (microns) # column 3 is the transmission probability # column 4 is the reflection probability 14.2 531.0 0.0618 0.9382 14.2 5

浏览 2提问于2016-06-18得票数 0

回答已采纳

1回答

在col名称相似时添加后缀

python、pandas、dataframe、join

我正在合并两个数据流，它们都有一个名为"man“的目录。在连接之后，一个col被称为"man_x“，另一个称为"man_y”。如果列名相同，是否可以追加表名或任何其他字符串，而不是x，y？ df_merged = df['first'].merge(df['second'], left_on=['posnr'], right_on=['fk_eakopf_

浏览 1提问于2021-10-07得票数 0

回答已采纳

1回答

星星之火-如何基于模糊名称获取所有相关列

python、scala、dataframe、apache-spark、apache-spark-sql

我有以下几个数据处理程序。目标是使用product_name作为键查找所有相关信息。问题是，有时它被称为prod_name或其他类似的名称。另外，如果product_name链接到ser_no，那么该数据帧中的信息也属于该产品。下面的例子，让我知道如果我能更好地解释这一点。有人能帮我弄清楚这件事吗？我试图在不显式地将它们连接在一起的情况下自动化这个过程，因为有许多这样的表，而且我不知道所有确切的表/col名称。基本上，我试图从这些蜂巢表中提取与product_name相关的所有信息。感觉就像星火connectedComponent api中的graphX，但不完全是？非常感谢你的帮助。 df

浏览 1提问于2021-08-28得票数 0

回答已采纳

3回答

基于Pandas中的公共列值合并两个数据框

pandas、dataframe

如何从具有共同列值的两个数据帧中获得合并的数据帧，使得只有那些行使得合并的数据帧在特定的列中具有共同的值。我有5000行df1格式： director_name actor_1_name actor_2_name actor_3_name movie_title 0 James Cameron CCH Pounder Joel David Moore Wes Studi Avatar 1 Gore Verbinski Johnny Depp Orlando Bloom Jack Davenport Pirates o

浏览 6提问于2017-04-09得票数 76

回答已采纳

2回答

从具有相同架构的其他表插入SQL

sql、sql-server-2008

Table1和Table2具有相同的模式、相同的列和相同的类型，并且Table2为空，而Table1有一些数据 Insert into Table2 values(Select * from Table1) 如何使用SQL语句进行数据传输？我认为oracle中的语法是有效的，但是如何处理sql-server呢？

浏览 1提问于2013-05-07得票数 1

1回答

将两个以上的数据文件与pd.merge()合并

python、python-3.x、pandas、merge、jupyter-notebook

我试图根据一个特定的列('filename')使用pd.merge()合并4个csv文件。我读到合并只对两个数据文件有效，而是尝试合并前两个，然后是第3个，然后是第4个，然后是连续的步骤。这一点最终起了作用，使用了以下代码： combine = pd.merge(file1, file2, on='filename', how='inner') combine1 = pd.merge(combine, file3, on='filename', how='inner') combine2 = pd.merge(co

浏览 3提问于2020-09-20得票数 1

回答已采纳

3回答

两列同名的data.frame :如何选择第二列？

r、dataframe

d1 <- data.frame(a=c(1,2,3)) d2 <- data.frame(a=c(3,4,5)) d3 <- cbind(d1,d2) 不会返回错误，RStudio中的环境检查将显示两个同名列。如果我输入： d3$a 选择第一列。如何按名字选择第二个？

浏览 7提问于2021-05-22得票数 2

回答已采纳

1回答

合并不同列上的多个数据格式

python、pandas、merge

使用Pandas 1.2.1 MRE： df_a = pd.DataFrame({"A":[1,2,3,4], "B":[33, 44, 55, 66]}) df_b = pd.DataFrame({"B":[33, 44,99], "C":["v", "z", "z"]}) df_c = pd.DataFrame({"A":[3,4,77,55], "D":["aa", "bb", "cc", "

浏览 2提问于2021-02-09得票数 1

回答已采纳

1回答

如何在熊猫获得ValueError中混合多个数据

python、pandas、merge

在使用Anaconda3 Spyder的Pandas中，我正在运行以下DataFrame合并摘录：我有两个数据格式，其结构如下： aur.columns ['Date','No','Clos'] bal.columns ['Date','No','Clos'] 两者都是Pandas DataFrames 我需要将它们合并到具有相同结构的另一个数据框架中： merg.columns ['Date','No','Clos'] 它们之间常见的列是“D

浏览 5提问于2017-11-22得票数 2

回答已采纳

1回答

当我尝试动态转换列并分配排序顺序时，Scala +Spark+Dataframe异常

scala、sorting、apache-spark、casting、comparator

我希望使用选定的列对数据进行排序，方法是将它们从giving类型转换为prederred类型和prederred order。，但是即使是简单的列转换也不起作用，从而导致了这种异常。我在这里提供了示例代码。 val conf = new SparkConf().setAppName("Sparkify").setMaster("local[*]") val sparkContext =new SparkContext(conf) val sqlContext = new SQLContext(sparkContext) var d

浏览 1提问于2016-04-14得票数 1

回答已采纳