pandas 添加列_pandas列列表添加_Pandas合并添加列 - 腾讯云开发者社区

python、pandas、data-science

import pandas series1 = pandas.Series({ 'a':1, 'b':2, }) dict = series1.to_dict() dict['c'] = 3 series2 = pandas.Series(dict) 我需要在series1上添加一个列/索引。当前，如上所述，我通过从series1的数据创建一个字典，添加一个索引，然后使用该字典创建一个新的系列来创建series2。有没有一种方法可以像pandas.DataFrame.join()或pandas.DataFrame.assign(

浏览 31提问于2021-04-17得票数 0

回答已采纳

1回答

如何获取" value“列的平均值，该列根据另一列的值拆分成组

python、pandas

我想以一个简单的数据帧为例，根据另一列("name“列)中的值，将一列(" value”列)求和成组。在那之后，我想得到"value“列的平均值 In [1]: import pandas In [2]: df = pandas.DataFrame(data = [{'name': 'a', 'val': 1}, {'name': 'b', 'val': 2}, {'name': 'b', 'val': 4}]) In [3

浏览 5提问于2021-03-03得票数 0

回答已采纳

1回答

如何在pandas中连接多个列名？

pandas

我想在pandas中用逗号分隔所有列。但是，正如您所看到的，这是非常费力的任务，因为我手动键入了所有列索引。 de = data[3]+","+data[4]+","+data[5]+....+","+data[1511] 你有什么想法在python3中避免pandas中的上述过程吗？

浏览 32提问于2020-01-09得票数 0

2回答

使用另一个数组应用函数pandas.Series中的参数

python、python-3.x、pandas、dataframe、series

有什么方法可以使用另一个pandas.Series的不同值在pandas.Series中应用函数吗？我知道有pandas.Series.apply()，但我需要这样的东西： array1 = pandas.Series([1, 2, 3, 4]) array2 = pandas.Series([5, 5, 6, 0]) def func(x, y): return x+y print(array1.apply(func, args = array2)) Out: 0 6 1 7 2 9 3 4 换句话说，我需要在一个pandas.DataFra

浏览 23提问于2021-04-07得票数 0

1回答

有没有一种方法可以用熊猫来编写.xlsx文件的公式，即不使用像xlsxwriter / openpyxl这样的工具？

python、pandas、xlsx

我编写了一个脚本，读取，然后创建一个列，该列是其他三列的总和，并将所有内容保存到一个新文件中： import pandas df = pandas.read_excel("excel-comp-data.xlsx") df["total"] = df["Jan"] + df["Feb"] + df["Mar"] df.to_excel("excel-comp-data-formula-by-pandas.xlsx") 这段代码的问题在于它没有创建，它只是将所有内容添加起来，并将结果放在新创建

浏览 4提问于2021-08-20得票数 3

回答已采纳

2回答

在Python/Pandas dataframe中创建新列时，有没有办法避免键入dataframe名称、括号和引号？

python、pandas、dataframe、sas

假设我有一个名为df1的Python/Pandas数据帧，其中包含列a和b，每个列只有一条记录(a =1和b= 2)。我想创建第三列c，它的值等于a+b或3。使用Pandas，我会写道： df1['c'] = df1['a'] + df1['b'] 我更喜欢写一些更简单、更容易阅读的东西，比如下面这样： with df1: c = a + b SAS允许在其“数据步骤”中使用这种更简单的语法。如果Python/Pandas有类似的东西，我会很高兴的。非常感谢!肖恩

浏览 13提问于2018-01-20得票数 3

回答已采纳

1回答

组合DataFrame中的列

python、pandas

有一个数据框架，如： import pandas df = pandas.DataFrame({'a': [1, 2, 3], 'b': [9, 8, 7], 'c': [4, 5, 6]}) df 我希望有一个数据框架，包括：一个因子/类别列['a', 'b']。这个专栏的名字，我不在乎。一个列，它具有a或b列的旧值，这取决于['a', 'b']因子。这个专栏的名字，我不在乎。保留c列值和名称(实际数据框架有几个列，我希望保留这些列)。我不关心结

浏览 0提问于2016-11-02得票数 1

回答已采纳

1回答

NaN-columns在pandas中绘制为全0列

pandas

在绘制整个列都填充了NaN的切片DataFrame时，我遇到了一些问题。怎么回事： pandas.DataFrame( dict( A=pandas.Series([np.NaN]*32), B=pd.Series(range(-1,32)) ) ).plot() 不同于： #Ugly fix pandas.DataFrame( dict( A=pandas.Series( [0] + [numpy.NaN]*32), B=pd.Series(range(-1,32)) ) ).plot() 通过

浏览 1提问于2012-07-27得票数 0

回答已采纳

1回答

尝试将小时、分钟和秒添加到dataframe python的日期时间列

python、pandas、datetime

我正在尝试将hh:mm:ss列添加到格式为YYYY\MM\DD hh:mm:ss的列中，但遇到一些错误。确切的数据在下面， col1 = 1:08:10 col2 = 2019/02/22 08:56:32 我正在尝试通过将col1添加到col2来获取col3 as 2019/02/22 10:04:42。我正在使用下面的代码， col3 = pd.to_timedelta(col2).dt.strftime("%Y/%m/%d %H:%M:%S")) + pd.to_timedelta(col1) 我得到的错误是， KeyError: '/'

浏览 58提问于2020-07-02得票数 1

回答已采纳

2回答

当我需要时，Dask drop()不会丢弃列

python、pandas、dask

我是新来的达斯克，列被删除的方式让我感到困惑。我已经把一个csv文件读到了Dask数据文件中。那么假设我有这个： print(len(columns_to_drop)) # There are 66 print(len(list(df.columns))) # The Dask columns before the drop df.drop(columns_to_drop, axis=1).compute(). # Drop the columns pd_df = df.compute() # Create a Pandas dataframe print(pd_df.shape[1

浏览 1提问于2021-12-14得票数 2

回答已采纳

1回答

unix datetime对话中出现Pandas错误-- OutOfBoundsDatetime:无法转换具有单元“%s”的输入

python、pandas

我得到了这个错误 File "pandas/_libs/tslib.pyx", line 356, in pandas._libs.tslib.array_with_unit_to_datetime pandas._libs.tslibs.np_datetime.OutOfBoundsDatetime: cannot convert input with unit 's' 尝试将pandas列转换为日期时间格式时。我检查了这个答案Convert unix time to readable date in pandas dataframe 但这并没有帮助我

浏览 89提问于2019-06-20得票数 1

回答已采纳

1回答

阻止Pandas写入不在源代码中的非ASCII字符

python-2.7、csv、pandas

使用Pandas，我从资源中提取CSV，并将其写入新的CSV以进行进一步处理。Pandas似乎正在将非ASCII字符写入第一个标题列，这些字符在源CSV中不存在。如何让Pandas在写入CSV时忽略那些特殊字符(它们看起来不会改变)？ “计算机名”必须包含特殊字符(\xef\xbb\xbf)，否则CSV中不会为该列写入任何内容。当我让Pandas将整个CSV下载到一个文件中时，我发现字符是问题所在，但当我将读数打印到终端时，特殊字符并不存在。 pandasdata = pandas.read_csv(r'\\mydrive\resource.csv') header = [&#

浏览 3提问于2016-09-30得票数 0

1回答

列的和: Pandas .sum()返回0.0

python、pandas、dataframe、csv、sum

我正在尝试使用.sum()和pandas对数据帧中的列的值进行求和。但是，对于数据类型为“float64 64”的所有列，pandas将返回“0.00”。对于设置为整数的列，它似乎工作得很好。这是我到目前为止尝试过的： df = pd.read_csv(csv_file, delimiter=';') df = df.apply(pd.to_numeric, errors='coerce').fillna(0) *#I want to convert values to numeric* print(df['UE'].dtype) *#I p

浏览 6提问于2021-03-17得票数 0

1回答

在Python中将选定的行从一个csv追加到另一个csv时会出现额外的列

python、pandas、dataframe、csv、concatenation

我有这样的代码，它将csv文件的一列作为一行附加到另一个csv文件： def append_pandas(s,d): import pandas as pd df = pd.read_csv(s, sep=';', header=None) df_t = df.T df_t.iloc[0:1, 0:1] = 'Time Point' df_t.at[1, 0] = 1 df_t.columns = df_t.iloc[0] df_new = df_t.drop(0) pdb = pd.read_cs

浏览 1提问于2022-02-21得票数 0

回答已采纳

3回答

尾随分隔符混淆熊猫read_csv

python、pandas、numpy、csv、delimiter

csv (逗号分隔)文件，其中的行有一个额外的尾随分隔符，似乎混淆了pandas.read_csv。(数据文件为1) 它将额外的分隔符视为有额外的列。因此，比标头所需的列还多一列。然后，pandas.read_csv将第一列作为行标签。总体效果是，列和标头不再对齐--第一列成为行标签，第二列由第一个标头命名，等等。这很烦人。知道怎么告诉pandas.read_csv做正确的事吗？我找不到一个。好书，BTW。 1: 2012年FEC选举数据库来自“数据分析Python”一书第9章

浏览 4提问于2012-12-05得票数 17

回答已采纳

1回答

熊猫ISO格式的时间戳在导入时会导致Exasol错误

python、exasol

当将 import_from_pandas(df)用于DataFrame时，具有datetime列的df会抛出一个错误，因为它无法解析dataframe列的ISO格式字符串表示形式。具体来说，"+00:00“最终字符是Exasol无法解析的。我目前的解决办法是将所有的熊猫日期时间列转换为字符串列，但这可能会花费大量的时间。将datetime列从Pandas导入到具有TIMESTAMP列类型的现有Exasol表的正确方法是什么？

浏览 2提问于2019-09-24得票数 2

回答已采纳

2回答

将新列插入到数据帧中会给出'ValueError:值的长度(4)与索引的长度(6)不匹配‘

python、python-3.x、pandas、data-science

我用pandas库创建了一个数据帧。我想向dataframe中添加一列。然而，我得到了以下error.But，我想我必须输入与lines.How数量一样多的数据，我可以在我想要的行和列中输入信息吗？如果不输入数据，如何创建列？ import pandas as pd kd = pd.DataFrame(data) insertColumns = kd.insert(0, "Age", [21, 23, 24, 21],True ) print(kd) 错误： ValueError: Length of values (4) does not match length o

浏览 302提问于2020-10-10得票数 2

回答已采纳

2回答

防止pandas自动推断read_csv中的类型

python、pandas

我有一个用#分隔的文件，它有三列:第一列是整型，第二列看起来像浮点型，但实际上不是，第三列是字符串。我尝试用pandas.read_csv将其直接加载到python中。 In [149]: d = pandas.read_csv('resources/names/fos_names.csv', sep='#', header=None, names=['int_field', 'floatlike_field', 'str_field']) In [150]: d Out[150]: <class &#

浏览 0提问于2012-08-24得票数 15

回答已采纳

1回答

无法安全地转换传递给列%1中的对象数据类型数据的float64的数据类型

pandas、csv

我正在尝试使用panda读取csv文件，这是数据在csv文件中的外观。 Freq Level 2412 -84 2412 -85 2412 -90 2412 -83 2412 -83 下面是我的代码： import pandas as pd x_data = pd.read_csv(data_path, encoding='utf7', dtype=float) print(x_data) 然后我得到了错误“不能安全地转换传递的使用float64的数据类型作为对象数据类型的数据” ~/anaconda3/lib/python3.7/site-packages

浏览 63提问于2020-02-22得票数 0

3回答

读取包含pandas的文件，并在两列上使用相关系数

python、pandas

我有一个像下面这样的文件，没有头文件 0.000000 0.330001 0.280120 1.000000 0.355590 0.298581 2.000000 0.305945 0.280231 我希望使用pandas dataframe读取此文件，并执行第二列和第三列之间的相关系数。我试着这样做： import pandas as pd df = pd.read_csv('COLVAR_hbondnohead', header=None) df['1'].corr(df['2']) 它会弹出一条巨大的错误消息。我没有正确地对待

浏览 7提问于2018-08-24得票数 0

回答已采纳

1回答

使用pandas Dataframe中的额外列，在现有sql表中创建新列

python、sqlite、sqlalchemy

我有几个希望写入SQL database的pandas Dataframe。但是，因为现有的SQL database可能没有pandas Dataframe中的特定column name，所以我收到一条错误消息，指出the column in the table was not found, thus unable to append data。 # Example: df1 out= column1, column2, column3, column4 value1, value2, value3, value4 df2 out= columnA, columnB, c

浏览 0提问于2016-07-24得票数 5

1回答

我可以在Pandas中使用OR条件删除行吗？

python、pandas、dataframe、drop

因此，我有一个包含多个列的数据帧，但真正重要的列称为A和B。如果列A不包含值X，或者列B不包含值Y，则必须删除该行。我尝试使用这个函数： def removeRows(df, value): df.drop(df[ (df['A'] != value) | (df['B'] != value)].index, inplace = True) return df But i got this error: A value is trying to be set on a copy of a slice from a DataFrame S

浏览 1提问于2021-03-10得票数 0

2回答

使用matplotlib在x轴上绘制包含时间数据的条形图

python、matplotlib、plot

我有一个包含两列的DataFrame，一列是字符串格式的一系列时间日期，另一列是一些值。我想把这个数据框画成条形图下面是我的代码： import matplotlib.pyplot as plt import pandas df = pandas.DataFrame({'a':['090000','093000','100000','103000'],'b':[2,3,4,5]}) df['a']=pandas.to_datetime(df['a'],format

浏览 2提问于2016-03-27得票数 1

1回答

Pandas:加速对大型SQLite数据库的查询

python、sqlite、pandas

我已经创建了一个包含32 in财务数据的SQLite数据库(我从csv文件开始，然后在pandas中使用to_sql命令)。更具体地说，该数据库有超过5.5亿行和6列(3个字符串列、2个浮点列和一个日期-时间列)。我想使用pandas执行一个简单的分组计数查询，但这似乎需要很长时间。我做了以下工作： import pandas as pd from sqlalchemy import create_engine disk_engine = create_engine('sqlite:///trade_data.db') df = pd.read_sql_query('

浏览 0提问于2015-05-07得票数 2

2回答

读取具有可变列数的CSV文件

python、pandas、csv

我有一个CSV文件，看起来 K1 ,Value M1,0 M2,10 M3,3 K2 ,Value,Value,Value M1,4,6,3 M2,7,3,4 M3,10,2,6 K1 ,Value,Value M1,0,4 M2,10,2 M3,3,7 该文件按5行分组。例如，第一个组的名称是K1，后面是一个具有固定3行和1列的dataframe。组中的行数是固定的，但列数是可变的。K1有1列，K2有3列，K3有2列。我想阅读它来形成一个字典，其中键是组的名称、K1、K2或K3，值是与组名相关联的dataframe。简单的类似于read_csv的df = pd.read_csv(

浏览 1提问于2021-11-26得票数 0

回答已采纳

1回答

计算每一行n列的平均值。

python、pandas、dataframe

根据pandas的248 rows x 101 cols数据，我需要计算一个新列，其中只包含所有sim-*列的平均值(不包括Date列)。

浏览 6提问于2022-07-03得票数 0

回答已采纳

4回答

如何获取一列中每个元素的长度

python、pandas

在csv文件中，有一个名为"no_pun“的列。里面有一些标记词。我想得到这个列中每个元素的长度。这在python中很容易实现。但我有个错误。我的代码： for i in range(0,len(data['no_pun'])): data["len_desc"][i] = len(data["no_pun"][i]) KeyError： KeyError Traceback (most recent call last) /anaconda3/lib/python3.6/site-packages/pandas/core

浏览 0提问于2019-04-07得票数 2

1回答

如何使用pandas过滤器和unique来测试if循环？

python、python-3.x、pandas

我有一个很大的DataFrame，我想检查一列的筛选器在另一列中是否存在唯一值。 import pandas df = pandas.DataFrame({'Site Name' : ['NYC','NYC','NYC','ATL'], 'Product Family' : [5,2,3,2]}) name = 'NYC' if 5 in df[(df['Site Name'] == name & df['Product Family']

浏览 21提问于2019-06-02得票数 0

回答已采纳

1回答

在Pandas行中为非float64类型的列创建null /NaN值

python、python-3.x、pandas

上一次我尝试将nan放入Pandas数据帧中时，它迫使我将列类型从int改为float。据我所知，在SQL中，任何类型的列中都没有'NULL‘的问题。我正在处理的数据帧经常进出SQL。现在我有了一个包含int、object和float列的数据帧，需要创建一些代码来编程添加一些单行，其中7列中的6列应该不包含任何内容，并且7列中只有1列被赋值。在Pandas中，有没有其他标准的'NULL‘东西可以放在不是float类型的列中？这一次，我肯定不能仅仅为了在其中放入一个nan而改变列的类型。

浏览 6提问于2018-02-28得票数 0

1回答

搜索5列中以05开头的字符串(不知道列的标题)

python、pandas、dataframe

在这种情况下，我需要创建一个excel工作表，该工作表接受1、2、3、4、5列中的所有行，并检查其行中的字符串是否以“05”开头(当时的每一列)。然后，在找到行之后，将它们与行(行的所有列)放在一个新的数据框架中。最后，它将从原始数据帧中删除这些行。这是我的代码，但是当它试图转到第6列时，我会得到一个错误：回溯(最近一次调用)：文件"/Users/Dd/PycharmProjects/mexcels/my_excel.py"，第19行，在new_df = data.loc[dataidc.str.startswith("05"，na=False)].copy

浏览 2提问于2021-07-04得票数 1

2回答

函数在熊猫数据帧列中的应用

python、python-3.x、pandas、function、functional-programming

这样做是正确的： import pandas as pd def fnc(m): return m+4 df = pd.DataFrame({"m": [1,2,3,4,5,6], "c": [1,1,1,1,1,1], "x":[5,3,6,2,6,1]}) df # apply a self created function to a single column in pandas df["y"] = df['m'].apply(fnc) df 我试着修改上面的代码。在这里，我需要将列m值添加到

浏览 2提问于2020-07-04得票数 1

回答已采纳

4回答

由于插入另一列，停止Pandas将int转换为浮动

python、pandas、type-conversion、type-inference

我有一个DataFrame，它有两列：int列和str列。我理解如果将NaN插入到int列中，Pandas将将所有的int转换为float，因为int没有NaN值。但是，当我将None插入到str列中时，Pandas也会将我的所有int转换为float。这对我来说毫无意义--为什么我在第2栏中输入的值会影响第1列？下面是一个简单的工作示例)： import pandas as pd df = pd.DataFrame() df["int"] = pd.Series([], dtype=int) df["str"] = pd.Series([

浏览 10提问于2016-10-26得票数 52

回答已采纳

2回答

如何在Pandas中合并/合并同一Dataframe中的列？

python、pandas、dataframe

我有一个类似于此的数据框架： 0 1 2 3 4 5 0 1001 1 176 REMAINING US SOUTH 1 1002 1 176 REMAINING US SOUTH 我想要做的是将第3列、第4列和第5列组合起来，创建具有列3、4和5中所有数据的on列。期望产出： 0 1 2 3 0 1001 1 176 REMAINING US SOUTH 1 1002 1 176 REMAINING US SOUTH 我已

浏览 0提问于2018-05-02得票数 1

回答已采纳

3回答

如何在pandas dataframe中添加新列的值？

python、pandas、dataframe

我想在Pandas数据帧中创建一个新的命名列，在其中插入第一个值，然后向同一列中添加另一个值：类似于： import pandas df = pandas.DataFrame() df['New column'].append('a') df['New column'].append('b') df['New column'].append('c') etc. 我该怎么做？

浏览 1提问于2018-07-24得票数 3

回答已采纳

1回答

如何从pandas中的数据透视表中产生干净的DataFrame

python、pandas、pivot

我有下一个问题。例如，我在Pandas中有next DataFrame a b c 'x' 1 100 'y' 2 100 'z' 3 100 现在，我希望从列a中的值创建新DataFrame的标题，列b中的值是我用于索引的第一行和列c中的对应值。目前我使用的是下面的代码： import pandas piv = df.pivot(index='c', columns='a') new_df = pandas.DataFrame(piv.to_records()) 输出不太适合我，因为我在一个新DataF

浏览 9提问于2018-08-07得票数 0

回答已采纳

1回答

将熊猫数据Number转换为Networkx对象时的边数不同

python、dataframe、networkx

我正在使用networkx从一个txt文件构建一个电子邮件网络结构，其中每一行代表一个“边缘”。我首先将txt文件(3列：{‘#发件人’、‘收件人’、'time'})加载到Python中，然后使用以下代码将其转换为networkx对象： import networkx as nx import pandas as pd email_df = pd.read_csv('email_network.txt', delimiter = '->') email = nx.from_pandas_dataframe(email_df, '

浏览 1提问于2017-09-19得票数 0

回答已采纳

4回答

使用apply()从两列创建新列

python、pandas、dataframe、apply

我想使用apply()创建一个带有Pandas DataFrame的列s['C']。我的数据集与此类似：在……里面 s=pd.DataFrame({'A':['hello', 'good', 'my', 'pandas','wrong'], 'B':[['all', 'say', 'hello'], ['good', '

浏览 1提问于2020-05-11得票数 10

1回答

删除.csv中的所有行，但列中的重复单元格除外

python、python-3.x、pandas

由于一些regex错误，.csv文件中有许多行相同，但格式略有不同，所以URL始终是常见的变量。我需要找到列"tx“中的url的所有副本，并删除第一列以外的所有其他内容。 .csv为50K行。系统是Windows。我试过的是： # importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("dupes.csv") # dropping ALL duplicte values df = data.drop_duplica

浏览 1提问于2018-11-03得票数 1

回答已采纳

1回答

检查列表的一个或多个元素是否存在于Pandas列中

python、python-3.x、pandas、numpy

此问题是以下问题Check if pandas column contains all elements from a list的扩展在问题中，为了派生输出，在Pandas列中检查列表的所有成员。我需要检查列表的一个或多个元素，即即使列表中只有一个元素与pandas列中的元素匹配，我也希望在输出中考虑这一点示例数据将为 frame = pd.DataFrame({'a' : ['a,b,c', 'a,c,f', 'b,d,f','a,z,c']}) letters = ['a','

浏览 30提问于2020-07-20得票数 0

回答已采纳

1回答

从现有数据帧的某些列创建新的pandas数据帧

python、pandas、dataframe

我已经阅读了将csv文件加载到pandas数据帧中，并希望对该数据帧进行一些简单的操作。我不知道如何根据从原始数据框中选择的列来创建新的数据框。我的尝试是： names = ['A','B','C','D'] dataset = pandas.read_csv('file.csv', names=names) new_dataset = dataset['A','D'] 我想用原始数据帧中的列A和D创建一个新的数据帧。

浏览 1提问于2017-07-11得票数 24

回答已采纳

4回答

Pyspark: Jupyter Notebook中的spark数据帧列宽配置

python、apache-spark、pyspark、spark-dataframe、jupyter-notebook

我在Jupyter Notebook中有以下代码： import pandas as pd pd.set_option('display.max_colwidth', 80) my_df.select('field_1','field_2').show() 我想增加列宽，这样就可以看到field_1和field_2的完整值。我知道我们可以对pandas数据帧使用pd.set_option('display.max_colwidth', 80)，但它对spark数据帧似乎不起作用。有没有办法增加spark数据帧的列宽，就像我们对p

浏览 2提问于2016-08-26得票数 2

1回答

如何使用两个键对射线数据集进行分组？

python、python-3.x、parallel-processing、distributed、ray

假设我想用A和B分组，然后计算销售额的总和？我该怎么做呢？ import pandas as pd import ray ray.init() rdf = ray.data.from_pandas(pd.DataFrame({'A':[1,2,3],'B':[1,1,4],'Sales':[20,30,40]}) 我确实尝试过执行rdf.groupby(‘A’，‘B’)，但是它给了我一个错误，说明键列不能是列表。

浏览 4提问于2022-11-04得票数 0

回答已采纳

1回答

pyodbc -在ms access中向现有表中写入新的数据列

python、pandas、ms-access、pyodbc

我有一个我已经连接到的ms access数据库(忽略驱动器名称中的...，它正在工作)： driver = 'DRIVER={...' con = pyodbc.connect(driver) cursor = con.cursor() 我有一个pandas dataframe，它与db中的表完全相同，只是多了一列。基本上，我使用pyodbc提取表，将其与外部excel数据合并以添加这一附加列，现在希望将数据推回到具有新列的ms access表中。包含新信息的pandas df是merged_df['Item'] 尝试像下面这样的东西是不起作用的，我遇到了各种

浏览 49提问于2019-12-19得票数 0

3回答

如何在忽略索引对齐的同时分配列

python、pandas

假设我在Pandas中有两个dataframes x和y，我想在x中填充一个列，结果是在y中对一个列进行排序。我试过这个： x['foo'] = y['bar'].order(ascending=False) 但是它不起作用，我怀疑，因为在分配过程中，Pandas 在x和y (它们有相同的一组索引)之间对索引。如何让Pandas使用另一个dataframe 中的另一列来填充，而忽略了对索引的对齐？

浏览 3提问于2013-04-12得票数 15

1回答

Python/Pandas/ JSON编写原始JSON输入

python、json、pandas

我非常习惯于使用Python，但到目前为止，我大多使用Pandas数据格式。要改变一下，我现在必须使用JSON输入。我已经找到了如何将它加载到Pandas 中，我的问题是是否可以保留原始输入JSON文件的嵌套结构，同时向它添加一个新的自定义列？我想用一些sklearn算法计算一个新列，并将它添加到原始输入文件中，同时保留JSON文件的结构(当然，添加一个新列除外)。有办法吗？谢谢!

浏览 5提问于2016-07-08得票数 0

回答已采纳

1回答

在sql导入后对数据进行编码

python、pandas、pyodbc

我用熊猫read_frame进口了一张桌子。我的DataFrame有一些特殊的字符，比如é，à等等。当我想展示它的时候，我有一些奇怪的字符。我想知道如何编码我的html输出： import pandas import pandas.io.sql from IPython.display import HTML df = pandas.io.sql.read_frame('a valid sql query') HTML(df.to_html()) 我需要使用HTML输出来显示所有列(我有90列)，这是我导入到csv时工作的编码'cp1252'。编辑后

浏览 3提问于2013-08-19得票数 2

回答已采纳

2回答

如何更改python中所有列的数据类型

python、pandas

我使用的是pandas数据帧。数据包含3032列。所有列都是'object‘数据类型。如何将所有列转换为“float”数据类型？ ? ?

浏览 30提问于2020-12-01得票数 1

回答已采纳

1回答

将系列列表串联到uid中。

python、python-2.7、pandas、pytest

我有一个Pandas数据框架，它包含几个列，这些列一起构成了唯一的标识符。我想编写一个通用的测试用例，它允许我将这些列连接到一个单独的列(uid)中，并测试该列的唯一性。我有以下代码作为非通用测试用例： import pandas as pd import pytest df = pd.DataFrame(columns=['one', 'two', 'three']) df.one = 'abc', 'def', 'ghi' df.two = 'jkl', 'mno'

浏览 1提问于2015-06-16得票数 1

回答已采纳

1回答

读取无头CSV到熊猫数据和解析日期

python、csv、pandas、dataframe

我正在尝试将类似于下面的CSV文件读取到pandas.DataFrame： 2011 1 10 AAPL Buy 1500 2011 1 13 AAPL Sell 1500 2011 1 13 IBM Buy 4000 2011 1 26 GOOG Buy 1000 数据没有列标题。在读取该文件时，我还希望将前3列解析为“date”列。因此，以下是我尝试过的： import pandas pandas.read_csv(fileName, header = N

浏览 1提问于2016-06-28得票数 1

回答已采纳

1回答

Pandas重写列

python、pandas

我有一个数据文件。它有几个包含数据的列，并且有两个列具有相同的名称。当我得到一个包含该文件中数据的pandas框架时，发现具有相同名称的列存在于单个实例中。也就是说，重写其中一列。我使用pd.read_table获取数据，其中pd是pandas 我看了熊猫的文档，但没有找到适合我的选择。请告诉我有一些属性，当创建一个框架的数据，考虑到相同的列的存在。我的英语很抱歉，非常感谢。

浏览 2提问于2017-04-26得票数 1