pandas concat vs合并M:M关系_Pandas以%Y%m%d%H：%M：%S格式合并日期列和小时列 - 腾讯云开发者社区

pandas、dynamic-memory-allocation

我读了大约30000个文件。每个文件都是一个具有相同数量的列和行数的csv。因此，我确切地知道矩阵的大小。我所做的是： #allocate a pandas Dataframe data_n=pd.Dataframe() for i in range(0,30000): #read the file and storeit to a temporary Dataframe tmp_n=pd.DataFrame({'Ping':Counter_4eh*m256,'SN':SN_4eh*m256,'Frequency':CF_4

浏览 10提问于2019-01-29得票数 0

回答已采纳

1回答

通过索引在python中组合数据帧

python、dataframe、merge

我有多个数据帧(由n分隔，然后由s分隔，然后由m分隔)，将其称为df1 for n= '239'，s= 'male'，m= 'is1'： Days 24hU 24hF ... 1 1e-3 .... ... 2 8e-4 .... ... 5 6e-4 .... ... ... .... .... ... 所有数据帧在行中都有相同的第一列'Days‘(可以设置为每个数据帧的索引)。我想要一个

浏览 21提问于2017-12-13得票数 0

回答已采纳

2回答

熊猫合并时KeyError

python、python-3.x、pandas

我是Pandas的新手，我试图在两个数据帧之间做一个左连接。我得到了一个KeyError。有人能发现我的错误吗？我想这可能是我错过的很简单的事情。谢谢! import pandas as pd import xlrd remediation_file = pd.read_excel('C:\\Users\garyd\\Desktop\\remediation-workbook.xlsx') exception_file = pd.read_excel('C:\\Users\garyd\\Desktop\\exception-finished-file.xlsx&#

浏览 0提问于2018-05-05得票数 2

回答已采纳

1回答

Pandas合并多个数据帧，查找值存储在多个列上

python、pandas、dataframe、merge、left-join

我想合并2个数据帧，其中查找值存储在多个列上。 import pandas as pd import numpy as np d1 = {'CODE': ['BBLGLC70M',np.nan, np.nan, np.nan, np.nan], 'CODE1': [np.nan, np.nan, np.nan, 'AALGLC71P', np.nan], 'CODE2': ['BBLG', np.nan, 'ZZTNRD77', 'PRI'

浏览 29提问于2020-11-09得票数 1

回答已采纳

2回答

合并Pandas中的数据格式会抛出“AssertionError:无法创建BlockManager._ref_locs”

python、merge、pandas

我正在尝试将几个文件从csv导入到单个DataFrame中，并在尝试添加第三个DataFrame时得到以下错误。 AssertionError: cannot create BlockManager._ref_locs because block [ObjectBlock: [CompletionDate, Categories, DateEntered_x, <lots more columns here>...], dtype=object)] does not have _ref_locs set 守则是： project = pandas.read_csv(read_csv

浏览 9提问于2013-08-11得票数 1

回答已采纳

2回答

通过合并多个长度未知的数据帧来创建数据帧

python、pandas、dataframe、concat

我正在尝试对棒球场地的F/x数据进行一些分析。所有的俯仰数据都存储在一个pandas数据帧中，其中包含像“俯仰速度”和“X位置”这样的列。我有一个包装器函数(使用pandas.query)，对于给定的音高，它将找到具有类似速度和位置的其他音高。此函数返回未知大小的pandas数据帧。我想在大量的投球上使用这个函数；例如，查找与在一场比赛中投出的投球相似的所有投球。我有一个函数可以正确地做到这一点，但它相当慢(可能是因为它不断地调整resampled_pitches的大小)： def get_pitches_from_templates(template_pitches, all_pitches

浏览 1提问于2015-03-07得票数 0

1回答

将多个数据帧连接在一起，并确保正确的数字进入同一列

python、pandas、merge

我有几个数据帧，它们都有一个"Dirty Price“和"Factor”，我想在同一列中包含它们。当我尝试这样做时，当我将第二个数据帧连接在一起，然后pandas创建了一个新的"Dirty Price_x“和"Factor_x”，但是我不想让我的新列合并到与我指定的条件匹配的同一列中。这是我所做的： df = df.merge(gs[['CUSIP', 'temp_Counterparty','Dirty Price','Factor']], how = 'left', on =

浏览 11提问于2020-04-22得票数 1

回答已采纳

1回答

表未被识别

python、pandas、tabula、python-camelot

import pandas as pd from tabula import read_pdf FileName="Filepath" DF3=read_pdf(FileName,multiple_tables=True,options="--pages 'all'", lattice= True) print DF3 import pandas as pd import camelot FileName="Filepath" tables = camelot.read_pdf(FileName,pages='1-en

浏览 10提问于2019-02-28得票数 0

1回答

将多个DataFrames与偶尔的重叠结合起来

python、pandas、dataframe

我有多个子数据帧，我从CSV文件中读取，我想使用pandas将它们组合成一个大的DataFrame。我的问题是，单独的子DataFrames中的一些列显示重叠。如果是这样，则需要将这些值插入到最终DataFrame中的正确位置。通常，所有子DataFrame都有一个ID列-所有这些ID的所有DataFrames值的set应该组合到最终的大DataFrame的ID列。每个ID都有一个特定的CODE分配给它，这在所有子DataFrame中是一致的，因此它可能总是被覆盖，因为值应该保持不变。我已经尝试了所有的方法，merge，join，concat，甚至普通的老式循环和索引，有索引的列，没

浏览 22提问于2019-01-30得票数 1

回答已采纳

2回答

追加在for循环中生成的pandas数据帧

python、pandas

我在for循环中访问一系列Excel文件。然后，我将excel文件中的数据读取到pandas数据帧中。我想不出如何将这些数据帧附加在一起，然后将数据帧(现在包含所有文件中的数据)保存为新的Excel文件。这是我尝试过的： for infile in glob.glob("*.xlsx"): data = pandas.read_excel(infile) appended_data = pandas.DataFrame.append(data) # requires at least two arguments appended_data.to_excel(&

浏览 2提问于2015-02-23得票数 111

回答已采纳

1回答

pandas concat vs合并M:M关系

python、pandas、dataframe

使用pandas 0.24.2。Merge, join & concatenate doc表示merge方法正在调用concat()函数。我加入了两个具有M:M关系的DataFrames，希望更好地理解concat()函数是如何工作的。此代码调用merge()方法并返回预期的结果： >>> import pandas as pd >>> left = pd.DataFrame([['001', 4123], ... ['001', 4855], ...

浏览 16提问于2019-03-20得票数 0

回答已采纳

1回答

使用熊猫将多个csv文件连接到一个文件夹中[MemoryError:]

python、pandas

我在一个文件夹中有5个csv文件，在这里我想将每个csv文件中的所有列连接到一个dataframe中。当我只加入2个csv文件时，它工作得很好，但是当我想加入5个csv文件时，我遇到了一个错误。我的代码如下： In [7]: import pandas import os import numpy as np import glob path =r'D:/PreprocessingITRC/output/All/' allFiles = glob.glob(path + "/*.csv") dataframe = pandas.DataFrame() for

浏览 4提问于2015-04-20得票数 2

回答已采纳

1回答

从多个URL下载csv数据，并将其合并为单个数据

python、pandas、dataframe、csv、concatenation

我是Python新手，在通过URL下载每个DataFrames之后，我尝试将多个1行的组合在一起。我一直在尝试使用熊猫pd.concat()，但没有成功。到目前为止，我正确地获得了单个DataFrames，但是使用以下脚本组合它们并不有效： import pandas as pd import time from time import sleep import numpy as np import glob import pathlib as pl2 count = 0 with open('tickertest12.txt', 'r') as my_fi

浏览 4提问于2022-10-20得票数 0

回答已采纳

2回答

pandas等同于R的cbind (垂直连接/堆叠向量)

python-3.x、pandas、concat、cbind

假设我有两个数据帧： import pandas .... .... test1 = pandas.DataFrame([1,2,3,4,5]) .... .... test2 = pandas.DataFrame([4,2,1,3,7]) .... 我尝试过test1.append(test2)，但它相当于R的rbind。如何将这两列合并为数据帧的两列，类似于R中的cbind函数？

浏览 4提问于2015-02-19得票数 45

回答已采纳

2回答

如何使用pandas读取一个目录中所有文件的内容？

python、python-2.7、pandas

我有一个文件夹，里面有很多.txt文件。如何使用pandas读取文件夹中的所有文件并获取其中的内容？我尝试了以下几种方法： import pandas as pd list_=pd.read_csv("/path/of/the/directory/*.txt",header=None) print list_

浏览 4提问于2015-01-03得票数 11

回答已采纳

1回答

如何使用Python将两个CSV文件合并为一个

python

我已经阅读了一些关于堆栈溢出的信息，比如这个，但是这个策略似乎并不适合我。我有两个要合并的csv文件，第一个文件如下所示：第二个看起来是这样的：我想把它们合并在一起，让它们并排在一起，如下所示：这就是我的代码的样子： # Find first school csv file in file explore file1 = file1_path_in_folder df1 = pd.read_csv(file1) df1.head() # Find second school csv file in file explore file2 = file2_path_in_

浏览 11提问于2022-08-17得票数 0

2回答

非数组对象连接方法

javascript、arrays

我试图理解数组方法，当我用vs代码编写代码并只调用array.prototype.concate.call()时，给出了正确的结果 console.log(Array.prototype.concat({}, 1, 2, 3)); ，但是当我尝试array.concate()时，它会给我一个错误. console.log(Array.concat({}, 1, 2, 3)); 错误信息： TypeError: Array.concat is not a function

浏览 4提问于2022-11-30得票数 -1

回答已采纳

2回答

使用pandas在dataframe中创建动态列

python、pandas

如何从此pandas数据帧创建动态列。 Name, Sex a, M b, F c, M d, F 预期的数据帧： Name, M, F a, 1, 0 b, 0, 1 c, 1, 0 d, 0, 1 我试过pandas.pivot()，但是没有用，你们能推荐点什么吗？

浏览 4提问于2016-08-01得票数 1

1回答

使用来自不同功能的多个返回数据集python大熊猫

python、function、csv、pandas

我正在处理3个数据集，我编写了3个不同的函数，每个数据集1个来做一些数据清理和操作。最后，我想将所有3个清理过的数据集合并到另一个函数中。我的逻辑： import pandas as pd def function1(): read in data as df df[(df.column1 != "")&(df.column2 != 'MRN')&(df.column3 != "C") ] return data1.to_csv() def function2(): read in data

浏览 1提问于2017-05-11得票数 0

回答已采纳

2回答

如何从下面的数据字典中对时间戳进行排序？

python、python-3.x、pandas、dataframe、python-requests

代码： import pandas as pd from pycoingecko import CoinGeckoAPI c=CoinGeckoAPI() bdata=c.get_coin_market_chart_by_id(id='bitcoin',vs_currency='usd',days=30) data_=pd.DataFrame(bdata) print(data_) data=pd.to_datetime(data_[prices],unit='ms') print(data) 输出：要求：但我需要输出，其中有4列：时

浏览 4提问于2021-11-30得票数 0

回答已采纳

1回答

从pandas dataframe列中删除前n-1个零

python、pandas、dataframe

df_in是样本数据帧，df_out是预期输出。如何删除前5个零，使我有一个零和所有其他元素。 import pandas as pd df_in = pd.DataFrame({'a':[0,0,0,0,0,0,1,2]}) df_out=pd.DataFrame({'a':[0,1,2]}) 提前谢谢。

浏览 5提问于2019-04-22得票数 0

回答已采纳

2回答

如何使用Pandas连接csv文件列表(包括空文件)

python、pandas、operating-system

我有一个存储在本地文件夹中的.csv文件列表，我正在尝试将它们连接到一个数据文件中。下面是我使用的代码： import pandas as pd import os folder = r'C:\Users\_M92\Desktop\myFolder' df = pd.concat([pd.read_csv(os.path.join(folder, f), delimiter=';') for f in os.listdir(folder)]) display(df) 只有一个问题，有时其中一个文件是空的(0 cols，0行)，在这种情况下，熊猫在第6行抛出

浏览 6提问于2022-08-14得票数 0

回答已采纳

3回答

Pandas合并两个具有相同行数的数据集

python、pandas

我有两个具有相同行数的表(第二个表是通过在T1中处理文本从第一个表计算出来的)。我将它们都存储为pandas dataframe。与T1不同的是，T2不是公共列。这是一个例子，因为我的表很大： T1: | name | street | city | |-------|---------|--------| | David | street1 | Prague | | John | street2 | Berlin | | Joe | street3 | London | T2: | computed1 | computed2 | |-----------|----------

浏览 4提问于2017-12-05得票数 9

回答已采纳

2回答

如何在Python中将几个Excel工作表合并成不同的表列？

python、excel、pandas、merge、glob

我有几张excel表格，列有以下不同的栏：表A: Col1 Col2 Col3 表B: Col2 Col4 Col5 表C: Col1 Col6 Col7 我的最后一张桌子应该是：最终表格: Col1 Col2 Col3 Col4 Col5 Col6 Col7 如果没有特定列的详细信息，则应保持空白。我一次只成功地执行了两个表的合并，但是我想将所有的表合并在一起。这是合并两个工作表的代码： import pandas as pd import numpy as np import glob df = pd.read_excel('C

浏览 0提问于2019-06-13得票数 2

1回答

AttributeError: collections.OrderedDict对象没有属性“to_excel”

python、pandas

我的代码如下： import pandas as pd df = pd.read_excel(r'C:\Users\user\Desktop\Test.xlsx',header=0,sheet_name=["Site 01","Site 08"],usecols="A:O") df.to_excel(r'C:\Users\user\Desktop\Test-result.xlsx', index=False) 我知道错误： AttributeError: 'collections.OrderedDic

浏览 4提问于2022-05-06得票数 1

回答已采纳

1回答

将多个csv文件合并成Python中的一个csv文件

python、pandas、csv、merge

我试图合并一些csv文件在一起。它们都有几个共同的栏，它们是： CU_NUMBER CYCLE_DATE JOIN_NUMBER CU_NAME PhysicalAddressLine1 PhysicalAddressCity PhysicalAddressStateCode 这些列的右边将是所有csv文件中感兴趣的各种列。现在，其中一些csv文件将有不同的专栏感兴趣，我仍然想合并。另外，有些文件可能没有相同的CU_NUMBER、CU_NAME、PhysicalAddressLine1、PhysicalAddressCity、PhysicalAddressStateCode。下面

浏览 3提问于2020-05-15得票数 0

回答已采纳

2回答

读取多个文件，并将它们堆叠到单个多级数据帧中。每个文件都有相同的列名

python、database、pandas

我想问一下，是否有人知道如何使用多级索引将多个数据帧堆叠成一个单独的数据帧，而不是像我正在做的那样堆叠成一个数据帧列表。谢谢 import glob import pandas as pd glist=glob.glob("./path/*.csv") D=[] for file in glist: X=pd.read_csv(file,names=['name1','name2','name3'],index_col = 0, header=0) D.append(X)

浏览 3提问于2017-08-11得票数 0

1回答

str_to_date和concat到单元日期和时间

mysql

str_to_date和concat功能与时间和日期相结合。我不知道如何在访问时将格式更改为导入、访问之后或直接填充。 CREATE trigger `trigger` before insert on `int` for each row BEGIN declare p, c, v, m, dublare int; declare dublare_inreg condition for 1062; declare continue handler for dublare_inreg begin set du

浏览 2提问于2016-10-25得票数 1

回答已采纳

1回答

使用Py循环将JSON文件目录转换为一个CSV文件

python、json、pandas、csv

我有一个包含数百个JSON文件的目录，希望将它们转换并合并到一个CSV文件中。我发现了的问题。一个答案解释了如何将一个JSON文件转换为CSV： import pandas as pd with open('jsonfile.json', encoding='utf-8') as inputfile: df = pd.read_json(inputfile) df.to_csv('csvfile.csv', encoding='utf-8', index=False) 使用该代码，我试图创建一个循环，但我无法使它工作(我

浏览 4提问于2022-06-28得票数 0

回答已采纳

1回答

为什么pandas join方法抛出错误？

python-3.x、pandas、dataframe、join

我正在尝试连接两个数据帧(main_df和df)。 print(main_df.head()) NSA Value SA Value Date 1975-01-31 34.531020 34.725199 1975-02-28 34.996924 35.157220 1975-03-31 35.476331 35.517737 1975-04-30 35.990021 35.874357 1975-05-31 36.581159 36.283538 print(df.head())

浏览 41提问于2020-05-09得票数 0

1回答

如何根据匹配日期连接两个数据帧？

python、pandas、dataframe

我想要连接两个作为pandas数据帧存储的地震目录。 import pandas as pd ISC = {'my_index': [0,2,3], 'date': ['2001-03-06', '2001-03-20', '2001-03-30'], 'magnitude': [4.7,4.7,4.9]} df1 = pd.DataFrame(data=ISC).set_index('my_index') USGS = {'my_index': [1,4],&

浏览 13提问于2019-02-21得票数 1

回答已采纳

2回答

Map.merge ..非静态方法不能从静态上下文引用。

java、java-8

我有以下代码： public List<String> myMethod(){ .. ...... Map<String, Module> m1 = new HashMap<>(); Map<String, Module> m2= new HashMap<>(); Set<Map.Entry<String, Module>> entries = m2.entrySet(); for( Map.Entry<String, Module> e

浏览 0提问于2018-12-21得票数 1

回答已采纳

1回答

使用循环合并python中的面板数据

python、pandas、loops、merge、panel-data

我正在尝试按idcode合并面板数据格式，并在我的数据文件中按“idcode”进行排序。我的数据变量名是wave68、wave69.、wave71。总的来说，我有两个问题：首先，我想使用循环对数据进行排序，但是我不知道如何分配循环文件名，即wave+i 第二，我不知道如何使循环算法正确地合并数据。我想要的最终结果是按“idcode”按波形68，69，70排序的宽窗体面板数据。通过使用循环。 import pandas as pd import numpy as np wave68 = pd.read_csv('panel_data/wave68.csv'

浏览 2提问于2017-12-04得票数 2

回答已采纳

3回答

Python中的MemoryError与pandas的大型合并

python、numpy、pandas、dataframe

我正在使用pandas对一组大约1000-2000个CSV文件进行outer合并。每个CSV文件具有在所有CSV文件之间共享的标识符列id，但是每个文件具有3-5列的唯一一组列。每个文件中大约有20,000个唯一的id行。我所要做的就是将这些列合并在一起，将所有新列合并在一起，并使用id列作为合并索引。我使用一个简单的merge调用来实现： merged_df = first_df # first csv file dataframe for next_filename in filenames: # load up the next df # ... merged_df

浏览 4提问于2013-06-20得票数 10

回答已采纳

3回答

Pandas concat不是连接，而是追加

python、pandas、dataframe、concatenation、concat

我希望能得到一些帮助。我正在尝试用多索引连接pandas中的三个数据帧。其中两个可以正常工作，但第三个一直在追加，而不是连接。它们都有相同的多索引(我已经用df1.index.name == df2.index.name测试过了) 这是我尝试过的： df_final = pd.concat([df1, df2], axis = 1) 示例： df1 A B X 0 1 3 2 4 df2 A B Y 0 1 20 2 30 我想得到的是： df_final A B X Y 0 1 3 20

浏览 0提问于2020-01-27得票数 0

1回答

从外部源导入大型数据集时Pandas中的最佳实践(使用SQL)

sql、python-3.x、pandas

我对Pandas比较陌生，我很想知道在将大型(10M+)数据集导入数据帧时，是否有任何经过验证的或更好的实践可以考虑，或者这些事情通常是如何完成的？或者，将SQL中的大数据直接导入pandas是完全可以的吗？例如，我想查询我的数据库，获取10M的rec，并将其存储为dataframe。在这种情况下，变量'query‘存储了从数据库返回的10M个recs的结果集，在pandas中完成这样的事情有多安全，特别是如果我们使用'query’进行更多的计算，或者是否有其他可用的替代方案？ import pandas as pd import pyodbc import sqlalch

浏览 22提问于2020-08-14得票数 1

2回答

Python & Pandas:根据不同csvs中的匹配编写列

python、pandas、csv

对于Python和Pandas来说，任何帮助或指导都是值得赞赏的。我正在使用两个不同的csv，roster.csv和assignment.csv，字段的结构如下： roster.csv first_name, last_name, user_id, user John, Doe, 0001, abcd Jane, Doe, 0002, efgh John, Smith, 0003, ijkl assignment.csv user, text abcd, text1 efgh, text2 ijkl, text3 当roster.

浏览 0提问于2021-08-22得票数 0

回答已采纳

1回答

如何合并pandas.core.series.Series类型的两个向量？

python、pandas

我有两个pandas.core.series.Series型向量。我怎样才能像两列一样合并这两列呢？使用pd.concat(X，Y)或pd.merge(X，Y)都给了我TypeErrors。 In [159]: X Out[159]: 0 11.896552 1 0.360488 2 2.244628 3 0.109661 4 6.447692 5 0.431621 6 0.320261 7 0.574196 8 0.585305 9 0.144247 10

浏览 6提问于2022-08-24得票数 0

1回答

再次卡住-需要向MySQL查询添加另一个GROUP_CONCAT

mysql、group-concat

感谢你们在我第一次尝试时的帮助我正在尝试向查询添加第二个group_concat，以将数据返回到VB.Net datagrid。我想将2列的结果汇总到新的列中，如下所示：现有数据 Date Sponsor Match_no Team -------------------------------------------- 1-1-11 Nike 1 Tigers 1-1-11 Nike 1 Bears 2-1-11 Crisco 2 Ll

浏览 6提问于2011-01-29得票数 0

回答已采纳

6回答

从熊猫数据中提取值

python、pandas、extract、overlap

我正在使用Pandas，并希望从多个数据文件中提取值。例如，有三个数据格式如下所示。 df1 = pd.DataFrame({'key': ['K0', 'K1'], 'A': ['A0', 'A1'], 'B': ['B0', 'B1']}) df2 = pd.DataFrame({'key': ['K1', 'K22'

浏览 9提问于2017-03-22得票数 1

回答已采纳

1回答

如何合并两个多索引的熊猫数据帧？

python、pandas、dataframe、merge

这里有两个熊猫数据帧： cq Assay Time Repeat ACTB 0 1 22.000170 2 21.882603 3 22.064980 4 21.838563 5 22.089467 cq Assay Time Repeat B2M 0 1 21.451

浏览 0提问于2017-02-28得票数 0

1回答

连接不同形状的数据帧

python、excel、pandas、dataframe、data-manipulation

它如何连接两种不同形状的数据帧？我的最终目标是将7个不同的数据帧组合在一起，然后导出到csv，这样所有的7个数据帧都可以在一个文件中查看。注意:所有的数据文件都有不同的标题。例如, import pandas as pd import numpy as np df1 = pd.DataFrame(np.random.randn(5, 4), columns= ['A', 'B', 'C', 'D']) df2 = pd.DataFrame(np.random.randn(4, 2), columns= ['X

浏览 1提问于2017-05-30得票数 0

1回答

合并两个Panda数据帧，并保留原始值

python、pandas、dataframe

所以我正在做一个项目，使用来自JHU CSSE的实时新冠肺炎数据。我目前有三个数据帧，每个数据帧代表确认病例、恢复病例和确认死亡的时间序列。每个数据框都包含包含以下信息的行:省/州、国家/地区，以及自数据记录开始以来的每一天的列，其中的值是该数据集的运行合计，无论是已确认、已恢复还是死亡。以下是数据集的示例： Province/State Country/Region Lat Long 1/22/20 ... 10/28/20 NaN Afghanista

浏览 0提问于2020-10-30得票数 0

1回答

删除pandas中的重复项时出现内存错误

python、python-3.x、pandas、dataframe

我试图删除基于两个列的重复项，但它给了我MemoryError，或者它在一段时间后终止了进程。你能帮我解决这个问题吗？示例：首先，我将3个数据帧连接成一个，然后丢弃重复的数据帧，但它给了我错误。你能告诉我我做错了什么吗？ df_final = pd.concat([df3, df2, df1_new], axis=1) df_final1 = df_final.drop_duplicates(subset=['SOURCE_ID', 'SOURCE_COLUMN_VALUE'], keep=False, inplace=True) 错误： Traceback

浏览 18提问于2020-06-07得票数 0

1回答

如何在Databricks中将数据框导出为excel

python、excel、pandas、pyspark、databricks

我想在一个excel表格中编写多个数据帧，无论是熊猫、考拉还是pyspark，并像xlwx一样做一些奇特的事情(改变单元格的大小或颜色等)，然后保存到S3存储桶中。我尝试过pandas.to_csv(s3.....test.xlsx)，但这不是我想要的。

浏览 17提问于2020-02-08得票数 0

2回答

第一个参数必须是熊猫对象的可迭代参数，您传递了一个类型为"DataFrame“的对象。

python、pandas、scikit-learn

我试图通过删除一些值和更改DateTime格式来保存新的CSV文件。我没有什么错误，但现在它.第一个参数必须是熊猫对象的可迭代性，您传递了一个类型为"DataFrame“的对象 import pandas as pd import calendar from datetime import datetime data1 = pd.read_csv("train.csv") data1['date']= data1.datetime.apply(lambda x : x.split()[0]) data1['hour']= data1.da

浏览 17提问于2022-04-26得票数 0

1回答

如何在我的dataframe中创建一个新变量，用dataframe名称填充值？

python、pandas、rename、columnname

我有一堆数据集，每个数据集都有相同的标题，每个数据集都指向不同的国家。我正在尝试在每个pandas数据帧中创建一个新列，其中填充了我的数据帧名称(这是国家的名称！) 我该怎么做呢？编辑：我没有提到我创建了数据集 us = pd.concat([coeff, pvalues], axis = 1).reset_index() us.columns = ['Factor',"Coeff","P-value"]

浏览 15提问于2019-01-10得票数 0

回答已采纳

1回答

如何使用python将多个csv文件连接为一个csv文件(使用列作为索引

python、pandas、csv、data-processing

我必须合并不同的csv文件，这些文件包含了基于place_id的关于一个地方的特征，这样我就可以创建一个模型来预测一个特定地方的评级。我已经尝试过使用pandas.concat并通过linux终端合并文件，但由于place_id不断重复，我只能得到所有其他功能的空值。 #importing libraries import pandas as pd import numpy as np import glob #creating a single dataframe fileList = glob.glob('chef*.csv') fileList.append(

浏览 0提问于2019-11-05得票数 0

3回答

有没有一个python函数来获取`value_counts()`，用于pandas数据框列和列表？

python、pandas、dataframe

我有一个列为list的数据帧 import pandas as pd data_dict = {"Trace" : [["A-M", "B&M", "B&Q", "BLOG", "BYPAS", "CIM"], ["B&M", "B&Q", "BLOG", "BYPAS"], ["

浏览 24提问于2021-08-01得票数 0

回答已采纳

2回答

即使密钥存在，KeyError也是如此

pandas、merge、keyerror

我正在尝试使用pd.merge合并两个数据帧。如果两个dataframe中都存在公司名称，我想从dataframe 2添加'Phone‘列。每次运行代码时，我都会得到KeyError='Company‘，即使这是我要合并的列名。我尝试过的东西： pd.merge(northstar,julie['Phone'], on='Company') northstar.merge(julie['Phone'], on 'Company') pd.merge('Company','Title'

浏览 0提问于2019-07-30得票数 0