基于其他列在pandas中编写新列_pandas基于其他列创建新列_在Pandas DataFrame中基于其他列创建新列 - 腾讯云开发者社区

python、pandas

我有以下玩具代码： import pandas as pd df = pd.DataFrame() df["foo"] = [1,2,3,4] df2 = pd.DataFrame() df2["bar"]=[4,5,6,7] df = pd.concat([df,df2], ignore_index=True,axis=1) print(list(df)) 输出：[0,1] 预期输出：[foo,bar] (顺序并不重要) 如果我能保证两个数据帧的标题是唯一的，有没有办法在不丢失原始列标题的情况下连接两个数据帧呢？我想到了遍历这些列，然后

浏览 1提问于2017-04-14得票数 16

回答已采纳

1回答

在DolphinDB中使用周频率进行类似熊猫的重采样

pandas、group-by、resampling、dolphindb

pandas支持多种频率的重采样。要在DolphinDB中实现类似pandas的重采样，我可以使用group-by子句，其中group-by列是对时间列的函数调用。例如，要使用月份频率进行重采样，我可以编写如下SQL： select count(*) from t group by month(myDate) 当涉及到周频率时，事情就有点不同了，因为DolphinDB没有像week这样的函数。此外，我希望在一周中的特定日期重新采样，例如，星期二。

浏览 1提问于2019-10-31得票数 0

2回答

如何在数据框某些行的所有列上使用pandas apply函数

python、pandas、data-manipulation

我有一台dataframe。我想要将某些行的所有列的值替换为默认值。有没有办法通过pandas apply函数做到这一点？这是数据帧 import pandas as pd temp=pd.DataFrame({'a':[1,2,3,4,5,6],'b':[2,3,4,5,6,7],'c':['p','q','r','s','t','u']}) mylist=['p','t'] 如何将列a和b中的值替换为默认值0，其中

浏览 13提问于2016-07-21得票数 2

回答已采纳

1回答

当CSV内容读取为列表时，pandas read_csv()返回带有.1和.2的重复条目

python-3.x、pandas

我正在使用pandas read_csv()方法将CSV文件的第一行读入列表，如下所示。 target_df = pandas.read_csv(file_absoulte_path, nrows=0, engine='python').columns.tolist() 并将上面返回的列表与另一个列表(expected_columns)进行比较，如下所示。 if(colums_expected==target_df): logger.info("Column names are CORRECT, as expected!"

浏览 2提问于2021-07-15得票数 1

1回答

在python中使用stop words清理推文列时的KeyError

python、nlp、nltk、tokenize、stop-words

我有一个推文的数据框架，我正在尝试清理我的“tweet”列-删除停用词并使用词汇化。下面是我的代码： stop_words = set(stopwords.words('english')) lemmatizer= WordNetLemmatizer() sentence = df['tweet'].apply(nltk.sent_tokenize) 0 [ 'country year happy'] 1 [ 'wish happy year'] 2 [ 'live year together']

浏览 49提问于2020-07-27得票数 0

1回答

Pandas的ReturnType随输入的不同而不同。-怎么处理？-火花公子

python、apache-spark、pyspark、user-defined-functions

我编写了一个熊猫UDF，它返回一个列的值，其中另一个列的最大值为 @F.pandas_udf("string") def belonging_to_max_udf(value_of: pd.Series, where_this_is_max: pd.Series) -> str : mx = where_this_is_max.max() if not pd.isnull(mx): return_value = value_of[where_this_is_max == mx] return return_value.iloc[0] retur

浏览 1提问于2021-12-16得票数 1

2回答

将Pandas转换回火花Dataframe后，先转换成另一种方式

pandas、apache-spark、pyspark、apache-spark-sql

我们有带蜂巢转移台的湖房建筑。我想对这些数据进行处理，所以我选择我的数据作为Spark。我想要完成的具体处理步骤是解析Spark中的日期列，这些列的格式非常奇怪：/Date(1582959943313)/，其中/Date(xx)/内的数字自纪元以来是毫秒。我认为通过转换我的Spark toPandas()，然后处理日期，我是很聪明的： df_accounts = spark.sql("SELECT * FROM database.accounts") df_accounts_pandas = df_accounts.toPandas() df_accounts_pandas[

浏览 9提问于2022-11-15得票数 0

2回答

如何将多个变量传递给pandas dataframe，以便将它们与.map一起使用来创建新列

python、pandas

要将多个变量传递给一个普通的python函数，您只需编写如下代码： def a_function(date,string,float): do something.... convert string to int, date = date + (float * int) days return date 在使用Pandas DataFrames时，我知道您可以基于一个列的内容创建一个新列，如下所示： df['new_col']) = df['column_A'].map(a_function) # This m

浏览 2提问于2015-05-22得票数 6

3回答

如何在pandas DataFrame中存储公式而不是值

python、pandas

是否可以像处理Excel电子表格一样使用pandas DataFrame :例如，通过在列中输入一个公式，以便当其他列中的变量发生更改时，此列中的值也会自动更改？类似于： a b c 2 3 =a+b 因此，当我更新2或3时，列c也会自动更新。 PS:显然可以编写一个函数来返回a+b，但是pandas或其他Python库中有没有内置的功能来以这种方式处理矩阵呢？

浏览 2提问于2013-08-03得票数 11

回答已采纳

1回答

在pandas中按列写入csv文件会引发错误

python、csv、pandas、pandas-datareader

我正在使用pandas读写一个csv文件。我正在逐列读取csv文件，并将其逐列写入单独的csv文件，但在写入csv文件时出现thorws错误 import pandas f1 = open('artist_links','a') data_df = pandas.read_csv('upc1.upcs_result.csv') #data_wr = pandas.to_csv('test.csv') df = data_df['one'] dd = data_df['two'] header =

浏览 0提问于2015-06-10得票数 0

2回答

python 3、pandas和创建新列失败，并出现keyerror

python、pandas、lambda、apply

我一直在数据帧上使用apply方法来创建新列。因此，如果我有一个如下所示的df： stdf.columns Index(['Username', 'First Name', 'Last Name', 'Class', 'Screens Typed','Time Spent', 'Avg Speed', 'Avg Acc'], dtype='object') 我一直在使用这样的语法来创建新列 stdf['uid'] = stdf[

浏览 0提问于2017-10-26得票数 5

1回答

Pandas将多个列组合到数组中的结果是ValueError

python、arrays、python-3.x、pandas

我想将Dataframe的多个列合并为一个，包含这些列的数组。这方面的简单示例： sn | a | b | c | ---+-----+-----+-----+ a1 | 1 | 1 | None| 至 sn | a | b | c | array | ---+-----+-----+-----+-----------+ a1 | 1 | 1 | None| [1,1,None]| 我之所以这样做，是因为我使用Pandas (和SQL-Alchemy)来解析我的数据，并使用Dataframe.to_sql将数据帧写入PostgreSQL表。我用

浏览 21提问于2017-01-26得票数 0

回答已采纳

2回答

如何在pandas中的一栏中创建词典？

python、pandas

我想在pandas上写一个空栏。例如，data‘’dict‘。我希望这个列中的每个元素都是一个空字典。例如： >>> data['dict'] {} {} {} {} 如何编写代码？非常感谢

浏览 5提问于2019-04-18得票数 1

1回答

如何更改dask数据帧中的行和列？

pandas、dask

我在使用Dask Dataframes时遇到了一些问题。假设我有一个包含2列['a','b']的数据帧如果我需要一个新的列c = a + b 在熊猫中，我会这样做： df['c'] = df['a'] + df['b'] 在dask中，我正在执行相同的操作，如下所示： df = df.assign(c=(df.a + df.b).compute()) 有没有可能以一种更好的方式编写这个操作，就像我们在pandas中所做的那样？第二个问题是更让我困扰的事情。在pandas中，如果我想将第2行和第6行的'

浏览 0提问于2015-09-03得票数 9

4回答

查找df列是否以值开头，并根据该值剥离或设置为none

python、pandas、dataframe

我是pandas的新手，我想知道我们是否可以编写一行代码来检查和转换使用lambda的列。 pandas列包含PL和TM之间的值。其思想是创建函数转换器，以便在“PL123”或“TM123”设置为“missing”时从列中剥离PL。提前感谢您的帮助！

浏览 23提问于2021-07-06得票数 0

1回答

使用相关矩阵中的目标变量列填充Python Pandas Dataframe

python、pandas、dataframe、class、correlation

我有一个由不同数据类型的45个变量组成的pandas数据框架，我正在使用'dython.nominal‘包来创建每个变量之间的关联矩阵。然后我想：答:子集我的数据帧(按地理位置过滤)，并在该子集上计算关联矩阵，然后 B:使用在步骤A中创建的数据帧中的目标变量的列，创建第二个pandas数据帧并添加到第二个pandas数据帧中。然后，得到的数据帧将是一个相关性矩阵，其中列索引是地理位置，行索引是其他44个变量。到目前为止，我拥有的代码是： import pandas as pd from dython.nominal import compute_associations t

浏览 0提问于2020-10-26得票数 2

2回答

为什么我们需要添加:当使用.iloc函数定义新列时

python、pandas

当我们在pandas中的dataset中创建新列时 df["Max"] = df.iloc[:, 5:7].sum(axis=1) 如果我们只获取从索引5到索引7的列，为什么我们需要传递: as所有列。

浏览 26提问于2021-08-09得票数 0

2回答

如果.csv文件中列下的一行包含1，则应使用python覆盖另一列中的同一行，否则应保留为空。

python、pandas、csv、multiple-columns、rows

我有一个大约30万行的.csv文件。我已经手动创建了一个新列，我希望从一些旧的列中提取信息，但是由于文件的长度，我不能手动地这样做。旧专栏的标题是存在的，在线的，缺席的，新的专栏是出席的。旧列的值为1和0，其中的观测值为true或false，也就是说，如果一个观察出现在事件中，则"Present“列的值为1，如果有其他情况，则该列的值为0。与“在线”和“缺席”栏相同。我希望新的列从旧的列中获取信息，也就是说，如果任何老的列的值为1，则“出席”中的同一行的值应该是“当前”、“在线”或“缺席”，这取决于哪一行是正确的。我一直试图使用Pandas来完成这个任务，但是还没有找到一种适用于.c

浏览 5提问于2020-03-26得票数 0

回答已采纳

1回答

用Pandas/Python在excel中填入一列，给出相应的数据

python、pandas

我正在尝试编写一个pandas/python脚本，在jupyter notebookssee excel data for example中执行以下操作我需要在列C中搜索每一行数据，并查看列E中该行对应的数字。然后，我希望它在列G中查找相同的数字，并将从E获得的相应值放入列I中。如果一个值在列C中有多个实例，而在列E中有不同的对应值，请标记这些列C的值，以便我可以查看。给定列C包含111，并且在列E中具有代码“a”，代码“a”将被放置在列I中具有数字111的任何位置。如果它们没有相同的数字，则用红色突出显示列C中的那些值。我很难弄清楚如何编写代码。如果有人能展示给我看，我将不胜感激

浏览 32提问于2019-12-24得票数 3

2回答

熊猫根据行中其他细胞的值给细胞赋值。

python、python-3.x、pandas、dataframe

鉴于以下数据框架： import pandas as pd import numpy as np DF = pd.DataFrame({'COL1': ['a','b','b'], 'COL2' : [0,np.nan,1],}) DF COL1 COL2 0 a 0 1 b NaN 2 b 1 我希望能够为每一行分配一个新列COL3，该列的值为2，其中COL1是b，

浏览 3提问于2016-01-17得票数 6

回答已采纳

1回答

使用DataFrame创建.loc以进行放大设置

python、python-2.7、pandas

我试图通过在Pandas (来自BeautifulSoup4)中迭代soup中的数据来创建一个soup。建议使用.loc方法来来创建DataFrame。但是，这个方法需要很长时间才能运行( 30,000行和5列的df大约需要8分钟)。有没有更快的方法。这是我的密码： import requests from bs4 import BeautifulSoup import pandas as pd url = "http://api.turfgame.com/v3/zones" r = requests.get(url) soup = BeautifulSoup(r.cont

浏览 2提问于2014-09-15得票数 2

回答已采纳

3回答

如何比较数据格式中同一列的数据(Pandas)

python、pandas、numpy、dataframe

我有熊猫的数据，如下所示：我想让那些国家的PIB在2007年比2002年少一些，但我不能仅仅用方法中的Pandas来编写代码，而不使用python迭代之类的东西。我所掌握的最多的是以下几行： df[df[df.year == 2007].PIB < df[df.year == 2002].PIB].country 但我得到了以下错误： ValueError: Can only compare identically-labeled Series objects 到目前为止，我只使用Pandas来过滤来自不同列的数据，但是我不知道如何比较来自同一列的数据，在本例中是一年。欢迎任

浏览 9提问于2020-10-01得票数 6

回答已采纳

1回答

熊猫列表达式和if else

string、python-2.7、pandas、concatenation

我正以这种方式在Python pandas中创建一个字符串表达式。 df['ABC'] = (df['A'] + ' + ' + df['B'] + ' + ' + df['C']) 但是，pandas返回此错误 TypeError: cannot concatenate 'str' and 'float' objects 数据帧中有几个列的NaN，对于这些情况，字符串连接失败。如何编写语句以实现

浏览 3提问于2014-07-11得票数 1

回答已采纳

2回答

Python pandas groupby by字典

python、dictionary、pandas-groupby

我有以下问题。在pandas数据框中，我有一列包含所有完整的单词和缩写。第二列带有一些浮点数。极性crypto_match_1 我想通过字典对这些列的单词和缩写进行groupby()。但是，该函数将单词和缩写分开分组。 crypto_ranking = dataframe_crypto.set_index('crypto_match_1').groupby(by=new_dict,axis=0).mean().reset_index()

浏览 1提问于2018-02-12得票数 0

4回答

如何获取一列中每个元素的长度

python、pandas

在csv文件中，有一个名为"no_pun“的列。里面有一些标记词。我想得到这个列中每个元素的长度。这在python中很容易实现。但我有个错误。我的代码： for i in range(0,len(data['no_pun'])): data["len_desc"][i] = len(data["no_pun"][i]) KeyError： KeyError Traceback (most recent call last) /anaconda3/lib/python3.6/site-packages/pandas/core

浏览 0提问于2019-04-07得票数 2

1回答

python for循环从列表中读取csv文件

python、pandas、loops、csv、append

我想使用for循环使用pandas读取csv文件。我已经把文件的名字列在一张名单里了。每次迭代之后，每个文件都必须附加到result。使用折叠代码，我只能追加一个文件： import pandas as pd files = ['fileA.csv' , 'fileB.csv'] result = None for files in files: df1 = pd.read_csv(files) df1['JourneyID'] = 'Journey2' df1.set_index( 'Jou

浏览 1提问于2018-02-06得票数 0

1回答

层顺序输入0与层不兼容:输入形状的期望轴-1值为6，但接收到的输入为形状(无，1)。

python、numpy、tensorflow、machine-learning、keras

我目前正在用Python编写一个使用Keras的机器学习回归程序。我得到不相容的输入形状错误..。请帮帮我！这是我的密码 import numpy as np import pandas as pd from keras import layers from keras import models from matplotlib import pyplot as plt from sklearn.model_selection import train_test_split data = pd.read_csv('path/to/csv', sep=','

浏览 1提问于2021-07-03得票数 0

回答已采纳

1回答

在Pandas中参数化列名

python、pandas

我想知道是否可以用参数化列名。我有个例子 import pandas as pd df = pd.DataFrame({'region':[1,2,3,4,5,6], 'id_1':[456, 456, 342, 987, 424, 424], 'id_2':[98, 87, 65, 65, 32, 43], 'id_3':[12, 12, 34, 34, 56, 56], '

浏览 0提问于2020-07-28得票数 1

1回答

在给定条件下将值赋给新的Pandas列

python、pandas、dataframe

我对潘达斯很陌生我想在Pandas中创建一个条件列。在R中，我可以通过变异来实现这一点，但是在Pandas.assign()中，这对我来说不太有意义。我想用伪代码做的是： DataFrame.MyKeyColumn = If (DataFrame.Condtional is NaN) then: concatenate[ DataFrame.keyfield1,"_",DataFrame.keyfield2,"_",DataFrame.keyfield3,"_",keyfield4] else: concatenate[ DataFram

浏览 0提问于2018-11-21得票数 1

回答已采纳

1回答

如何在Pandas DataFrame中移动列而不丢失值

python、pandas、dataframe

我想在Pandas DataFrame中移动一列，但我还没有找到一种方法来做到这一点，同时又不丢失值。(这篇文章与非常相似，但经过验证的答案并没有给出所需的输出，我无法对其进行评论)。有人知道怎么做吗？ ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 期望产出： ## x1 x2 ##0 206 nan ##1 226 214 ##2 245 234 ##3 265 253 ##4 283 271 ##5 nan 291

浏览 3提问于2016-03-16得票数 3

回答已采纳

1回答

在Python中使用Pandas将选择性数据值作为浮点数写入csv/txt文件

python、pandas、csv、file

使用这个平台的互联网信息/信息，我设法写了一个小的Python代码，它读取200CSV，然后能够区分对应于列的索引的不同值。现在我有兴趣写一个csv/txt文件，其中2列应该有一个变量“时间”和另一个变量"alpha.water“。使用下面的Python脚本，我可以编写一个变量"time"： # importing different modules import os import numpy as np import pandas as pd import matplotlib.pyplot as plt import math import importlib

浏览 40提问于2021-04-07得票数 0

回答已采纳

2回答

如何在pandas中使用向量化而不是for循环

python、pandas、dataframe、for-loop、vectorization

我正在尝试为我的工作建立一个机器学习算法。我用于训练和测试的数据有17k行和20列。我试着在另外两个列的基础上添加一个新列，但是我编写的for循环太慢了(需要3秒才能执行) for i in range(0, len(model_olculeri)): if (model_olculeri["Bel"][i] != 0) and (model_olculeri["Basen"][i] != 0): sum_column = (model_olculeri["Bel"][i]) / (model_olculeri["

浏览 59提问于2021-10-25得票数 0

回答已采纳

1回答

使用Pandas迭代CSV行，执行Selenium操作

python、pandas、selenium

我有一个使用Pandas创建的CSV文件。以下是以下代码的输出： test = pd.read_csv('order.csv', header=0) print(test.head()) 3 16258878505032 0 3 16258876670024 1 3 16258876899400 2 3 16258876997704 我需要处理的唯一数据是第二列中的信息和第三列中的信息。这是采购订单数据，其中第二列表示“数量”，第三列表示"sku“。我需要获取第1行，第2列，并使用selenium将其注入到输

浏览 19提问于2019-03-11得票数 1

回答已采纳

3回答

如何在Pandas中忽略列中的值？

python、pandas、pandas-groupby

我想知道--一旦选择了列，如何忽略该列中不需要的/不必要的值？例如，假设我有一个10x2的df import pandas as pd data = [['jamie', 30], ['cersei', 30], ['tyrion', 25], ['tywin', 56], ['robb', 18], ['jon', 18], ['arya', 9], ['sansa', 14], ['bran', 7], ['nedd', 42]

浏览 28提问于2019-12-30得票数 0

回答已采纳

1回答

向NumPy公开C字符串的最快方法？

python、c、arrays、numpy、cython

我正在用Python将一些旧的文本日志转换成可用的格式。这些文件很大，所以我正在编写自己的C扩展名，以尽可能快地运行这些文件，并使用正则表达式解析相关字段。我的最终目标是将这些字段导出到strings的strings数组中。我知道可以在C中将NumPy数组创建为PyObject，然后对每个元素调用SetItem，但我希望尽可能地进行优化。我可以使用类似于memcpy PyBuffer_FromMemory 或PyBuffer_FromMemory之类的东西直接将C字符串读入 NumPy string 数组吗？--我知道NumPy数组在内部类似于C数组，但是否必须确保连续地分配NumPy数组？

浏览 5提问于2016-08-24得票数 3

回答已采纳

1回答

可以使用dataframe ix进行赋值，但不能进行检索

python、pandas

我循环遍历pandas df的行，循环索引i。我可以使用ix函数分配几列，其中循环索引作为第一个参数，列名作为第二个参数。但是，当我尝试使用此方法检索/打印时， print(df.ix[i,"Run"]) 我得到一个下面的Typerror: str对象不能解释为整数。在某种程度上与Keyerror有关：“Run” 我不太确定为什么会发生这种情况，因为Run确实是数据帧中的一列。有什么建议吗？ Traceback (most recent call last): File \!"C:\WPy-3670\python-3.6.7.amd64\lib\site-packa

浏览 0提问于2019-07-27得票数 2

1回答

有没有办法用python在elasticsearch中添加一个累积的索引？

python、pandas、elasticsearch、kibana、elastic-cloud

希望你今天过得愉快！我正在尝试将数据从python脚本导入到elasticsearch索引中。索引必须每隔一段时间(10分钟)接收一次数据，并在python脚本每次完成该过程时积累所述数据，当然，也不要忘记可以在kibana中绘制它的第一个数据。我正在使用eland从elastic获取数据，执行一个进程(使用pandas)，并使用pandas_to_eland ()将信息发送到elastic。问题是索引忘记了新的传入数据。下面是我正在做的事情： while(True): #Get data from elasticsearch eland_data = ed.DataFrame

浏览 5提问于2021-07-16得票数 1

1回答

如何在没有列标题的情况下为pd.read_csv指定数据类型？

python、pandas

我目前正在编写代码来分析大量的数据。我已经使用pandas读取了文本文件，并使用data.head()打印它。我需要为9列指定数据类型(第九列为null)，因为否则这个过程会占用太多内存，但是我不知道如何为缺少列标题的列指定数据类型。这是否与为列标题指定dtype相同？作为参考，我的列数据类型可能如下所示：第1列:混合，因为它包含字母数字字符第2列:日期，格式为YY/MM/DD 第3列:以小时/分钟/秒/毫秒为单位的时间第4列: Str 第5列:时间第6列: Str 第7列:时间第8列:时间第9列:空下面是我的代码的摘录 import sys import os

浏览 0提问于2020-05-29得票数 0

2回答

熊猫DataFrame将函数应用于多列并输出多列

python、pandas、dataframe、apply

我一直在寻找应用函数的最佳方法，该函数采用多个独立的Pandas DataFrame列，并在同一列中输出多个新列，DataFrame说。假设我有以下几点： def apply_func_to_df(df): df[['new_A', 'new_B']] = df.apply(lambda x: transform_func(x['A'], x['B'], x['C']), axis=1) def transform_func(value_A, value_B, value_C): # do som

浏览 3提问于2019-11-11得票数 8

回答已采纳

1回答

熊猫根据非常数的值第三列将值从一列复制到另一列。

python、pandas、dataframe、nan

我有一个大的数据集，它是一个巨大的表，实际上应该是许多表。标头被隐藏在子集的行中。我的目标是将这些标题提取到一个新的列中，这样我就可以通过该列进行筛选，以获得我想要的数据(每次一个头)。为此，我创建了一个空的标题列。在NaN列中，SCORE列中的第一个值是我想要的HEADER，而该列中的第一个值总是由3个NAME值组成。所以我在考虑这种关系可以被利用。目前的Pandas数据框架具有这样的结构： s = '''HEADER,NAME,SCORE NaN,Header 1,NaN NaN,Random Junk,NaN NaN,Random Junk,NaN NaN,E

浏览 3提问于2021-12-04得票数 3

回答已采纳

1回答

向DataFrame添加列是否涉及复制数据？

python、performance、python-3.x、pandas、internal

我的问题只是关于性能，而不是语义。向df添加新列是否会导致将现有DataFrame中的数据物理复制到新的内存位置(例如，以确保DataFrame占用连续内存)？ # using pandas 0.18.1, python 3.5 import pandas as pd df = pd.DataFrame({'a': range(100)}) b = pd.Series(range(100)) df['b'] = b # is this operation expensive? # equivalently df.loc[:, 'b'] = b

浏览 2提问于2016-06-20得票数 4

1回答

如何在迭代过程中修改Pandas系列(DataFrame)？

python、pandas、reference、iteration、in-place

根据另一个函数，我需要在Pandas系列(列)中重新定义值。在迭代过程中，在得到结果之后，我不想查找这个系列两次，因为我想它是浪费时间的，而不是必需的。例如： import pandas as pd s = pd.Series(['A', 'B', 'C']) for index, value in s.items(): s[index] = func_hard_to_vectorized(value) # lookup again!!! 用C++，的话来说，“如何获得那个单元格的引用？” 我想要的是： import panda

浏览 10提问于2022-10-27得票数 1

回答已采纳

1回答

使用Pandas连接和追加循环中的列

python、sql-server、pandas

我希望将循环中生成的表中的列附加到dataframe中。我本来希望用pandas.merge来完成这个任务，但它似乎并不适合我。我的代码： from datetime import date from datetime import timedelta import pandas import numpy import pyodbc date1 = date(2017, 1, 1) #Starting Date date2 = date(2017, 1, 10) #Ending Date DateDelta = date2 - date1 DateAdd = DateDelta.day

浏览 1提问于2017-05-03得票数 0

回答已采纳

1回答

关于python，将列合并为新列，同时将int更改为浮动

python、vaex

我能够编写函数将列合并为新列，但在更改为string以进行合并之前，无法将int列更改为float列。我希望在新的合并列中，这些整数具有挂起的".00000“。最后，我试图将合并列作为在多个键/列上连接两个vaex的键。由于金库只接受一个列/键连接两个金库，我需要将合并列作为键。如果一个金库中的列是int，而另一个金库中的列是浮动的，则int更改为float。代码如下。函数new_column_by_column_merging正在工作，但函数new_column_by_column_merging2不工作。想知道是否有办法让它发挥作用。 import vaex import

浏览 8提问于2022-10-28得票数 0

2回答

将R中一列中的值除以另一列中的值

我已经读过如何将R中一列中的值除以另一列中的值，但我想知道如何将多列中的值除以单列中的值。另外，我的第一个专栏是由非数字组成的。如何用R编写脚本来完成所有这些操作并避免非数字类型？在下面的.csv文档中，我想用SVL来划分HDL和HDW species SVL HDL HDW PM 26.68 9.27 9.83 PM 23.46 8.41 8.59 PM 24.15 8.36 8.1 PM 23.09 8.91 8.79 Tioman 31.8 11.65 11.18 Tioman

浏览 7提问于2016-09-12得票数 4

1回答

-tableView:objectValueForTableColumn:row:是强制性的吗？

objective-c、cocoa、nstableview

在中，概述说tableView:objectValueForTableColumn:row:是“必需的”。紧接着，它说“仅基于单元格的表”需要tableView:setObjectValue:forTableColumn:row:，这意味着编写文档的人知道基于视图的表，而基于视图的表需要tableView:objectValueForTableColumn:row:。方法tableView:objectValueForTableColumn:row:本身的文档说明：注意事项：除非应用程序使用Cocoa绑定向表视图提供数据，否则此方法是强制性的。但与其他方法不同的是，没有提到对基

浏览 1提问于2014-03-25得票数 7

回答已采纳

3回答

如果列不在特定列表中，则从Pandas数据框中删除这些列

pandas

我有一个熊猫数据框架，它有一些列。如果列没有显示在列表中，我想删除这些列。 pandas数据框列： list(pandas_df.columns.values) 结果： ['id', 'name' ,'region', 'city'] 和我期望的列名： final_table_columns = ['id', 'name', 'year'] X次运算后的结果应该是： list(pandas_df.columns.values) ['id', 'name&#

浏览 18提问于2019-07-05得票数 13

回答已采纳

1回答

如何对另外两列的总和求和

python、pandas

我有一个带有一些列的df。我可以得到“利润”栏和“佣金”栏的总和。我正在尝试从列‘利润’和‘佣金’中获得总和的新列‘净利润’，但我只能获得列表的串联或列中每行的总和 gross_profit = [df['Profit'].sum()] commissions = [df['Commission'].sum()] 我尝试过的： df['net_profit'] = df['Profit'] + df['Commission'] df['net_profit'] =

浏览 14提问于2020-08-29得票数 2

3回答

在NaN中创建新列结果

python、pandas

我尝试在csv file.But中创建一个包含3列的新列，如果其中一个列值为NaN，则整个值将更新为NaN，而不是跳过它。* import pandas as pd import numpy as np df = pd.read_csv(r'C:\Users\RAHNA KM\Downloads\Accident_death.csv', skipinitialspace=True) df['Address']= df["ResidenceCity"].astype(str) +" "+ df["ResidenceCount

浏览 20提问于2019-10-23得票数 1

1回答

pandas中面向对象的数据帧清理模式

python、dataframe、oop

我需要在面向对象模式下编写python代码的帮助。我正在尝试使用pandas标记数据帧中的列值。有没有人可以帮助我如何入门，或者向我推荐一些资源？如何声明一个全局变量并指定温度和湿度的范围，然后编写一个函数来标记超出该范围的值？下面是我的代码： import pandas as pd filename = 'data.csv' #Read the dataframe and display the column names in the dataframe df = pd.read_csv('data.csv', encoding="Latin&#

浏览 15提问于2020-05-08得票数 0