Pandas:基于现有列的值创建新列

Pandas是一个基于Python的开源数据分析和处理库，它提供了丰富的数据结构和数据分析工具，可以轻松处理和分析大量的结构化和非结构化数据。

基于现有列的值创建新列是Pandas中一项非常重要的功能，它可以通过对现有列的运算或逻辑操作来创建新的列。这在数据处理和分析中非常常见，可以根据现有列的值进行衍生计算或创建新的特征。

在Pandas中，我们可以使用DataFrame的apply、map、applymap等方法来实现基于现有列的值创建新列的操作。以下是一些常见的创建新列的示例：

基于数值列的运算：
基于数值列的运算：
基于字符串列的操作：
基于字符串列的操作：
基于日期列的操作：
基于日期列的操作：

基于现有列的值创建新列的功能可以广泛应用于数据预处理、特征工程、数据分析和机器学习等领域。它可以帮助我们方便地进行数据加工和转换，从而更好地理解和利用数据。

在腾讯云的生态系统中，与Pandas相关的产品和服务包括腾讯云的大数据平台、人工智能平台、数据库服务等。例如，可以使用腾讯云的数据仓库服务TDSQL来存储和管理数据，使用腾讯云的机器学习平台Tencent Machine Learning进行数据分析和模型训练。具体的产品介绍和链接地址可以参考腾讯云官方网站。

如何将新列添加到带有pandas的MySQL？

、、、

我的理解是，您可以从数据库(在本例中为MySQL)中提取数据，将这些数据加载到pandas df中进行操作(添加新列、在MySQL中不易完成的复杂计算等)，然后将新列重新加载到SQL中。但是，在将新创建的列添加回MySQL中提取原始数据的同一现有表的最后一步中，我遇到了问题。我找到的唯一一个类似的问题是，但我在某个地方遗漏了一个关键组件。我正在使用pandas to_sql来执行这个任务(有更好的选择吗？)我的代码从我的MySQL表中提取加密数据，将其加载到pandas df中，并且我添加了一个新的波动率列(我知道您可以用SQL计算，这只是一个示例)。 SQL表(加密) date

浏览 0提问于2018-04-02得票数 1

3回答

如何在pandas dataframe中添加新列的值？

、、

我想在Pandas数据帧中创建一个新的命名列，在其中插入第一个值，然后向同一列中添加另一个值：类似于： import pandas df = pandas.DataFrame() df['New column'].append('a') df['New column'].append('b') df['New column'].append('c') etc. 我该怎么做？

浏览 1提问于2018-07-24得票数 3

回答已采纳

1回答

如何使用pandas数据帧set_index()

、、

让我们创建一个包含两列的pandas dataframe： lendf = pd.read_csv('/git/opencv-related/experiments/audio_and_text_files_lens.csv', names=['path','duration']) 下面是默认的数字递增index ? 让我们更改index以允许按path属性进行搜索： lendf.set_index(['path']) 但是index并没有改变？？ ? 调用reindex()怎么样？ lendf.

浏览 9提问于2020-04-22得票数 0

回答已采纳

1回答

根据其他列的值设置列的值(Pandas)

、、

我最后一次使用Python是在很久以前，所以有些东西已经褪色了。我有一个给定的数据集，包含多个列。我希望创建一个新列，并根据其他列的多个值(文本或值)设置值。因此，在下面的示例中，c1由A，a，b，b和c2 of A，b，a，b组成。现在，我希望新列c3是1,2,3,4 感谢所有的帮助！ import pandas as pd data = pd.read_excel('data') data['c3'] = 0 for i in range(len(data.c3)): if data.c1[i] == a and data.c2[i] ==

浏览 0提问于2020-05-11得票数 1

2回答

为什么使用pandas.assign而不是简单地初始化新列？

、

我刚刚发现了熊猫数据帧的assign方法，它看起来很不错，非常类似于R中的dplyr的mutate。然而，我总是通过‘动态’初始化一个新列来获得它。有没有assign更好的原因？例如(基于pandas文档中的示例)，要在dataframe中创建一个新列，我可以这样做： df = DataFrame({'A': range(1, 11), 'B': np.random.randn(10)}) df['ln_A'] = np.log(df['A']) 但是pandas.DataFrame.assign文档建议这样做： df.assi

浏览 1提问于2018-01-10得票数 32

回答已采纳

1回答

使用DataFrame创建.loc以进行放大设置

、、

我试图通过在Pandas (来自BeautifulSoup4)中迭代soup中的数据来创建一个soup。建议使用.loc方法来来创建DataFrame。但是，这个方法需要很长时间才能运行( 30,000行和5列的df大约需要8分钟)。有没有更快的方法。这是我的密码： import requests from bs4 import BeautifulSoup import pandas as pd url = "http://api.turfgame.com/v3/zones" r = requests.get(url) soup = BeautifulSoup(r.cont

浏览 2提问于2014-09-15得票数 2

回答已采纳

2回答

将if语句应用于数据框架元素

、、、、

下面是我要做的工作: 1.读取csv文件2。创建一个列号107，并根据以下条件从第67列复制值：‘只有当第70列中的行值为“Yes”时才复制值代码： report <- read.csv("C:\\Users\\ha317981\\Desktop\\practice\\input.csv", header=1) for(i in 1:length(report[[70]])-1){ if(report[[i, 70]] =="Yes"){ report[[i,107]] <-report[[i, 67]] }

浏览 8提问于2017-02-17得票数 0

回答已采纳

2回答

Pandas: Dataframe.Drop - ValueError:轴中不包含labels ['id']

、

正在尝试从Pandas中的DataFrame中删除列。从文本文件创建的DataFrame。 import pandas as pd df = pd.read_csv('sample.txt') df.drop(['a'], 1, inplace=True) 但是，这会生成以下错误： ValueError: labels ['a'] not contained in axis 以下是sample.txt文件的副本： a,b,c,d,e 1,2,3,4,5 2,3,4,5,6 3,4,5,6,7 4,5,6,7,8 提前谢谢。

浏览 0提问于2017-02-08得票数 8

4回答

如何获取一列中每个元素的长度

、

在csv文件中，有一个名为"no_pun“的列。里面有一些标记词。我想得到这个列中每个元素的长度。这在python中很容易实现。但我有个错误。我的代码： for i in range(0,len(data['no_pun'])): data["len_desc"][i] = len(data["no_pun"][i]) KeyError： KeyError Traceback (most recent call last) /anaconda3/lib/python3.6/site-packages/pandas/core

浏览 0提问于2019-04-07得票数 2

2回答

数据帧列值计算和替换

、、、、

我需要您的帮助来计算DF列的新值，然后用计算出的值替换旧值。我是新人，在粘贴代码时遇到了问题(很抱歉)：在36年内 import pandas as pd import numpy as np import math import random df = pd.DataFrame({'beerstyle': ['light', 'dark','light', 'dark'], 'beername': ['coors', 'guiness','bud'

浏览 2提问于2015-09-11得票数 1

2回答

如何从sql数据库中的另一列创建具有相同值和结构的列

、

如何创建列并从另一个表的现有列中复制值和结构？我的尝试： CREATE COLUMN database.table.column SELECT * FROM database.table2.column

浏览 3提问于2016-01-28得票数 0

2回答

如何将Pandas系列插入现有Excel文件的特定列(而不删除该文件中的内容)？

、、、、

我用熊猫从Excel中导入了以下数据： import pandas as pd sht = pd.read_excel(path, 'Table', index_col=None, header=None, usecols = "A:C") sht.head() |-------+------------+----------| | jon | tyrion | daenerys | | sansa | cersei | rhaegar | | arya | jaime | 0 | | bran | tyw

浏览 5提问于2018-09-16得票数 2

回答已采纳

1回答

如何在定义新行主键的同时复制表中的一行？

、

我想在定义PK列值(2) (tblSpills.Year，tblSpills.Complaint)时复制或复制表(tblSpills)中的一行。我已经有一个存储过程，它插入一个带有自定义PK值的新行，并且每隔一列(大约30列)为空。到目前为止，我已经执行了现有的存储过程来创建新的行，并将新的PK值作为新的Duplicate存储过程的变量，但是我不知道如何将剩余的列从同一个表中的一行复制到新创建的行。感谢您能提供的任何帮助。

浏览 3提问于2011-04-22得票数 1

回答已采纳

1回答

Python熊猫:从现有列中创建日期的数据

、、

我有一只熊猫的数据栏，列了好几年，还有一个几个月。如何在这两种基础上创建新的日期列(我可以假设day = 15)。我尝试了以下几点： import pandas as pd import numpy as np import datetime df = pd.DataFrame() df['year'] = np.arange(2000,2010) df['mydate']= datetime.date( df['year'].apply(lambda x: int(x)) , 1 , 1) 但我得到了一条错误信息：应用(lambd

浏览 1提问于2015-07-02得票数 0

回答已采纳

1回答

Python数据框架:在下一个单元格上将数据写入csv

、、、

我希望将值从Pandas dataframe写入下一个直接单元格，而不是写入csv文件中的第一行/列，该文件如下所示： |column 1| Column2| Column 3| |--------|--------|---------| | | | | | |data | data | | |data |data | 我尽力了，pandasdf.iloc1,1= pandasdf 但是，现有的值正在被取代，有办法做到这一点吗？是否可以以这种方式创建sql表？

浏览 4提问于2022-02-16得票数 1

回答已采纳

1回答

如何复制与熊猫列，并更改名称？

、

在Python 3和Pandas中，我拥有以下数据： te.info() <class 'pandas.core.frame.DataFrame'> Int64Index: 5541 entries, 0 to 5664 Data columns (total 13 columns): DATA_LS 4118 non-null object DATA_INCLUS 2957 non-null object Proprietario 5541 non-null object Nome_propried

浏览 1提问于2017-11-27得票数 0

回答已采纳

1回答

数据报添加带有条件的新列，并基于另一列

、

我有客户rfm的数据。示例数据如下： df_cust = pd.Dataframe( 'CustNo' = [001, 002, 003, 004], 'Recency' = [5,10,200,150], 'Frequency' = [1, 3, 10, 1] ) 我想创建一个新的列‘score_ create’。我也有两个计算分数的函数(通常我使用lambda函数来创建列pandas)。 def cal_new_cust(recency): return score # logic code with new cust fr

浏览 10提问于2021-05-23得票数 0

2回答

在蟒蛇大熊猫中创建新列时的KeyError

、、

我正试图在蟒蛇熊猫中创建一个新的专栏，我一直得到一个(不稳定的)重新出现的KeyError。脚本的部分非常简单，所以我不确定是什么导致了错误，因为dataset中没有一个列具有相同的名称。我的目标是创建一个新列，并将其附加到包含ticket_contents列内容的新翻译的dataframe中。这是一个样本的数据； 25483 0 outstanding 0 Los-Angeles e-payment delayed Ticket 1/7/19 7:54 39363 0 outstanding 0 Los-Angeles e-payment delayed

浏览 0提问于2019-02-26得票数 0

回答已采纳

2回答

如何在数据框某些行的所有列上使用pandas apply函数

、、

我有一台dataframe。我想要将某些行的所有列的值替换为默认值。有没有办法通过pandas apply函数做到这一点？这是数据帧 import pandas as pd temp=pd.DataFrame({'a':[1,2,3,4,5,6],'b':[2,3,4,5,6,7],'c':['p','q','r','s','t','u']}) mylist=['p','t'] 如何将列a和b中的值替换为默认值0，其中

浏览 13提问于2016-07-21得票数 2

回答已采纳

2回答

Pyspark:如何应用pandas_udf？

、

我正在尝试在pyspark中应用pandas_udf。我有一个pyspark数据帧，如下所示： +-------------------+------------------+--------+-------+ | lat| lon|duration|stop_id| +-------------------+------------------+--------+-------+ | -6.23748779296875| 106.6937255859375| 247| 0| | -6.2374877929687

浏览 2提问于2020-05-14得票数 2

1回答

用Python实现按列值拆分excel表格的自动化

、、

假设我有一个巨大的excel表，包含多个列和条目。但是，存在包含布尔值0和1的特定列(列A)。现在，我希望根据A列的值将我的父excel工作表拆分为两个工作表。我已经知道可以使用VBA代码来完成此操作。但是，我想在python上尝试一下。我的想法是，我们可以遍历上述列值，如果满足某个条件，则选取整行并将其写入新的工作表中。我正在学习这门语言，可以使用numpy和pandas来创建线性回归模型之类的。我想做这个“个人项目”。如果有人愿意帮助我，提供一些提示或一些开始的东西，我会很高兴的。谢谢。

浏览 1提问于2020-03-10得票数 1

1回答

解析、删除和屏蔽IP地址的脚本

、、、

我有一个CSV文件，包含3列：列1- -总值--连接ID_IP地址51515151 99.999.999.999 第2栏-时间栏-时间209-02-25T19:04:59.999-0500 第3栏- IP地址(IPv4 & IPv6) - IP 99.999.999.999 我试图解析第一列中的ID，方法是将其拆分为带有ID和IP地址的两列，然后使用新创建的IP地址丢弃该列，因为它们已经包含在第3列中。这是我到目前为止掌握的代码： import pandas as pd from pandas import read_csv df1= pd.read_csv(&

浏览 0提问于2019-02-28得票数 0

1回答

如何在Pandas DataFrame中移动列而不丢失值

、、

我想在Pandas DataFrame中移动一列，但我还没有找到一种方法来做到这一点，同时又不丢失值。(这篇文章与非常相似，但经过验证的答案并没有给出所需的输出，我无法对其进行评论)。有人知道怎么做吗？ ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 期望产出： ## x1 x2 ##0 206 nan ##1 226 214 ##2 245 234 ##3 265 253 ##4 283 271 ##5 nan 291

浏览 3提问于2016-03-16得票数 3

回答已采纳

1回答

ExtJS 6.2 :为网格列创建自定义筛选器

、、、

我想为我的网格列创建一个自定义过滤器。我试过这个： Ext.define('Myapp.grid.filters.filter.Float', { extend : 'Ext.grid.filters.filter.Number', alias : ['grid.filter.float'], type : 'float', config : { serializer : function (f) { return { type : 'float'

浏览 3提问于2016-12-15得票数 1

回答已采纳

3回答

如何在SQL Server2005中将列添加到视图

、、

我没有使用SQL Server 2005的经验。我被分配了一项任务来修改视图，以便向视图中添加4列。有没有可能在没有反映在视图引用的表中的列更改的情况下执行此操作。如果我有表中的列，那么我是否应该删除视图并创建一个新的视图，或者有什么方法可以更改它。

浏览 0提问于2011-02-09得票数 4

回答已采纳

2回答

从dataFrame中保存表中的现有项

、

我有一个数据文件，其中有几个行，其中一些已经存在于db中。我想更新现有行的几个列。我们怎么能做到呢？我看到我们有SaveModes:追加和覆盖，这可能是为了达到目的，但在这两种情况下都有限制。及其附件，我得到了主键错误，因为此选项试图在db中创建一个新行，并使用ovverride，我将为tuple.中未更改的属性松散值。请有人建议我如何更新一行(元组)的几个属性(列值)。

浏览 2提问于2020-08-04得票数 0

回答已采纳

2回答

生成数据帧，但只获得1行

、、、

我希望使用Python中的faker库来创建一个dataframe，但是我只能得到一个行，不理解代码中的问题是什么。这里也是这样： import pandas as pd for dat in range(int(input())): dat = [[fake.email(),fake.phone_number(),fake.address(),fake.name(),fake.date(),fake.pyint(0,3)]] v = pd.DataFrame(dat, columns=['Email','PhNo','Address'

浏览 2提问于2021-02-12得票数 1

回答已采纳

1回答

生成Pandas+Uncertainties AttributeError:类型对象'dtype‘没有属性’AttributeError‘

、、、

我想使用 + 。我收到了一个奇怪的错误，在MWE下面： from uncertainties import ufloat import pandas number_with_uncertainty = ufloat(2,1) df = pandas.DataFrame({'a': [number_with_uncertainty]}) # This line works fine. df.loc[0,'b'] = ufloat(3,1) # This line fails. 我注意到，如果我尝试添加ufloat的“动态”(就像我通常对float或其他东西所

浏览 3提问于2022-01-26得票数 1

2回答

pandas.DataFrame.assign:如何引用新创建的列？

、、、

我试图在Pandas 1.5.2中使用pandas.DataFrame.assign。让我们考虑一下下面的代码，例如： df = pd.DataFrame({"col1":[1,2,3], "col2": [4,5,6]}) df.assign( test1="hello", test2=df.test1 + " world" ) 我正面临这个错误： AttributeError: DataFrame对象没有属性“test1” 但是，它明确指出：可以在同一个assign中分配多个列。**kwargs中的

浏览 1提问于2022-11-28得票数 1

回答已采纳

4回答

在SQL Server中更改身份种子(永久！)

、、

有没有办法永久更改标识列的标识种子？使用DBCC CHECKIDENT似乎只是设置last_value。如果表被截断，则所有值都将被重置。 dbcc checkident ('__Test_SeedIdent', reseed, 1000) select name, seed_value, increment_value, last_value from sys.identity_columns where [object_id] = OBJECT_ID('__Test_SeedIdent'); 返回 name seed_value increme

浏览 27提问于2010-01-26得票数 12

回答已采纳

2回答

将函数应用于使用2列并创建新列的所有行

、、、

我有一个包含两列的Dataframe (date作为索引) date col_a col_b 1.1.2020 23 34 我想应用一个函数，使用两列并创建第三列(错误) date col_a col_b col_error 1.1.2020 23 34 0.4 这是我的数据帧 ? 下面是带有TypeError的代码(抱歉，我无法提供数据:( ) def mean_absolute_percentage_error(y_true, y_pred): y_true, y_pred = np.array(y_

浏览 15提问于2020-01-21得票数 0

回答已采纳

1回答

来自两个字段的唯一值索引

、

我是pandas和python的新手，绝对需要一些帮助。我有下面的代码，它几乎就是我想要的。它为字段中的唯一值创建虚拟变量，并通过其他两个字段中唯一值的唯一组合对它们进行索引。我想要的是用于索引的字段的每个唯一组合只有一行。现在，如果虚拟变量出现3次，我会得到多个行，比如'asset subs end dt' = 10/30/2008和'reseller csn' = 55008。我宁愿在虚拟变量列中使用一行来表示索引字段值和3的组合。 Code: df = data df = df.set_index(['ASSET_SUBS_END_DT&#

浏览 0提问于2014-05-30得票数 0

2回答

Python:使用len()根据其他列的值创建新列

、、、、

我的dataframe是一个熊猫dataframe，有许多行和列。现在，我希望基于对象列的值创建一个新列(系列)。例如： df.iloc0，'oldcolumn‘输出为0，应该在新列中给出，并且 df.iloc1，'oldcolumn‘输出为'ab%$.’。应该在相同的新列中给我5 (包括文字数量)。空间)。此外，是否有办法避免循环或自己的函数？谢谢你

浏览 7提问于2020-08-29得票数 0

1回答

将数据帧转换为系列创建NA

、、

我已经下载了dataframe，并尝试从此DataFrame创建pd.Series data = pd.read_csv(filepath_or_buffer = "train.csv", index_col = 0) data.columns Index([u'qid1',u'qid2',u'question1',u'question2'], dtype = 'object') 以下是DataFrame中的列，qid1是question1的ID，qid2是question2的ID，my Data

浏览 2提问于2017-04-03得票数 1

2回答

熊猫DataFrame将函数应用于多列并输出多列

、、、

我一直在寻找应用函数的最佳方法，该函数采用多个独立的Pandas DataFrame列，并在同一列中输出多个新列，DataFrame说。假设我有以下几点： def apply_func_to_df(df): df[['new_A', 'new_B']] = df.apply(lambda x: transform_func(x['A'], x['B'], x['C']), axis=1) def transform_func(value_A, value_B, value_C): # do som

浏览 3提问于2019-11-11得票数 8

回答已采纳

1回答

为什么在获取数据时使用NaN值？

、、、

from sqlalchemy import create_engine import pymysql import pandas as pd db_connection_str='mysql+pymysql://username:pwd@Host/DB' db_connection = create_engine(db_connection_str) df = pd.read_sql('select * from tbl_store_inventory', con=db_connection) print(df) 执行此代码后，我将获得所有列的NaN值。

浏览 23提问于2019-10-11得票数 0

1回答

Pandas Dataframe中的计算列链

、

我正在将金融电子表格转换为Pandas，这是一个经常出现的挑战。在excel中，假设您有这样的计算:对于列0:n，该值取决于前一列，格式为Cell (row，column)：Cell(1，n) = (Cell(1，n-1)^2)*5。显然，对于n=2，您可以在Pandas中创建一个计算列： df[2] = (df[1]^2) *5 但对于30个这样的连锁店来说，这是行不通的。所以目前，我使用的是for循环。 total_columns_needed = list(range(0,100)) for i in total_columns_needed: df[i] = (df[i-1

浏览 0提问于2015-09-02得票数 2

1回答

更新Google数据融合复制作业以反映Server表架构

、、

我创建了一个数据融合复制作业来在测试数据库中复制一些表。如果我不更改表模式，它在开始时工作得很好。但是我添加了一个新列，该列在复制作业中被忽略。我想，如果我创建一个新的表，甚至那个表也会被忽略。是否有方法包括模式更新(新表、更新列字段、新列等)在已经运行的数据融合复制作业中？我想一个可能的解决方案是停止当前正在运行的作业，并创建一个新的作业，包括新表、新列等。但是我想避免一个新的工作会再次复制所有的数据库。有什么解决办法吗？

浏览 9提问于2022-10-27得票数 1

回答已采纳

3回答

熊猫专栏创作

、、

考虑到创建新列的下列尝试之一似乎失败了，我很难理解列命名约定背后的概念： from numpy.random import randn import pandas as pd df = pd.DataFrame({'a':range(0,10,2), 'c':range(0,1000,200)}, columns=list('ac')) df['b'] = 10*df.a df 给出以下结果：但是，如果我试图用下面的行替换来创建列b，则不会出现错误消息，但是dataframe只保留列a和c。 df.b = 10*df

浏览 1提问于2016-04-28得票数 2

1回答

熊猫爆炸以创建新列

、、

pandas explode方法为在给定列的内部列表中找到的每个值创建新行；这是一种逐行分解。 pandas中是否已经实现了简单的列式分解，即将df转换为第二个数据帧？ MWE： >>> s = pd.DataFrame([[1, 2], [3, 4]]).agg(list, axis=1) >>> df = pd.DataFrame({"a": ["a", "b"], "s": s}) >>> df Out: a s 0 a [1, 2] 1 b

浏览 14提问于2021-07-05得票数 0

1回答

在Python中将图像分配给pandas数据帧的元素

、、

我有一个pandas数据帧，其中一列是图像( numpy数组格式的单通道uint8 2d图像)。我使用iterrows()遍历各行，并处理图像，我希望将结果(其他图像，格式相同)传递给dataframe的其他列的元素。我有一个关于图片的专栏。 for index,row in df.iterrows(): image=df['image'] processed=process_image(image) df.loc[index,'processed_image']=processed 但是，当我尝试使用.loc或.at (或.iloc，

浏览 11提问于2020-12-22得票数 0

1回答

使用Pandas解析大型CSV中的JSON列w/嵌套值

、、、、

我有一个巨大的CSV文件(3.5GB，每天都在变大)，它有正常的值，还有一列名为“元数据”的嵌套JSON值。我的脚本如下所示，其目的只是将JSON列转换为其每个键值对的普通列。我正在使用Python3 (Anaconda；Windows)。 import pandas as pd import numpy as np import csv import datetime as dt from pandas.io.json import json_normalize for df in pd.read_csv("source.csv", engine='c',

浏览 0提问于2018-06-22得票数 3

回答已采纳

1回答

将一列添加到大数据集块中

、、

我有如下示例代码： def return_table_df(table_name, chunksize,conn): try: df = pandas.read_sql_table(table_name,conn, chunksize=chunksize) return df except Exception as e: logging.error(e) data_frame_chunks = return_

浏览 2提问于2017-09-15得票数 0

回答已采纳

1回答

插入从sqlite中列的第一行开始的值

、

这是我在这里的第一篇帖子。我是sqlite的新手，也是Python编程本身的新手！所以，对不起，如果我的问题是愚蠢的！:) 我试图迭代地将一些值存储在sqlite数据库列中，这些值稍后将用于创建新列并保持代码运行。我的问题是，当创建一个新列时，向它写入值不是从新列的第一行开始，而是从上一列的最后一行开始。假设上一列有100行长，则在新生成的列中写入值从第101行开始。下面是我正在使用的代码的一部分： ...some lines.... iter=1 # counter for the iteration number which will be used in naming the

浏览 3提问于2014-06-10得票数 0

回答已采纳

1回答

在数据表和系列中添加单个项和项序列

、

假设我有一个数据文件df import pandas as pd df = pd.DataFrame() 我有以下的元组和值： column_and_row = ('bar', 'foo') value = 56 如何才能最容易地将这个元组添加到我的dataframe中，以便： df['bar']['foo'] 返回56 如果我有这样的元组列表和值列表，该怎么办？例如： columns_and_rows = [A, B, C, ...] values = [5, 10, 15] 其中A、B和C是列和行的元组(类似于column_

浏览 0提问于2013-04-04得票数 0

回答已采纳

2回答

将新列插入到数据帧中会给出'ValueError:值的长度(4)与索引的长度(6)不匹配‘

、、、

我用pandas库创建了一个数据帧。我想向dataframe中添加一列。然而，我得到了以下error.But，我想我必须输入与lines.How数量一样多的数据，我可以在我想要的行和列中输入信息吗？如果不输入数据，如何创建列？ import pandas as pd kd = pd.DataFrame(data) insertColumns = kd.insert(0, "Age", [21, 23, 24, 21],True ) print(kd) 错误： ValueError: Length of values (4) does not match length o

浏览 302提问于2020-10-10得票数 2

回答已采纳

2回答

.replace代码不会用python中的新列替换列。

、

我正在尝试阅读python中的一个列，并使用python创建一个新列。 import pandas as pd df = pd.read_csv (r'C:\Users\User\Documents\Research\seqadv.csv') print (df) df = pd.DataFrame(data={'WT_RESIDUE':['']}) codes = {'ALA':'A', 'ARG':'R', 'ASN':'N', 'A

浏览 2提问于2021-04-27得票数 2

回答已采纳

2回答

用Python将excel表导入SQL数据库

、、、

我有由第三方程序创建的SQL数据库，我用python将一些数据从excel表导入到sql。这是数据库和excel表的预览；正如您所看到的，sql和excel列的名称完全匹配。这是我用来导入的代码； import pandas as pd import sqlite3 #Paths excel_path="C:/users/user/desktop/ACC_Import.xlsx" sql_db_path="c:/users/P6_BD_DataBase_001" #Defs df=pd.read_excel(excel_path, dtype={

浏览 1提问于2022-03-01得票数 0

回答已采纳

3回答

在Pandas系列中对值进行迭代，以便在需要时替换值

、、、、

我正试图通过一个Pandas系列来迭代。如果列‘%’‘%可再生’中的值大于'%可再生‘列的中值，则应在新列中将该值分配给1否则，该值应保持原样。新系列'HighRenew'中每一项的值应根据条件是否满足而改变。 for value in Reducedset['% Renewable']: if value >= Reducedset['% Renewable'].median(): Reducedset['HighRenew'] = 1 else: Reduced

浏览 5提问于2020-05-14得票数 2

回答已采纳

1回答

自动生成Microsoft威胁建模工具模型

、、

我在中有一个上下文模型，我想将它导入到 (MTMT)中。在查看用于表示模型的XML文件之后，它在某种程度上看上去不可读/散列。我希望能够从我的图形my模型生成一个(一般的) MTMT模型。我无法找到MTMT的XML模型的任何文档。这里有人了解MTMT文件，这些文件可以帮助我完成创建将图形XML转换为MTMT模型的工具所需的解析吗？

浏览 13提问于2016-10-27得票数 1

回答已采纳