我正在使用下面的代码来绕过被零除的错误,仍然得到一个错误,不能弄清楚这里到底出了什么问题。
df.loc[:,'B to A Ratio'] =np.where(df.loc[:,'A']!=0,df.loc[:,'B']/df.loc[:,'A'],np.nan)
仅供参考,我正在对从数据透视表创建的数据框执行此操作。这里的“A”列和“B”列只是为了说明。
我在逻辑回归之前对我的数据进行特征缩放。 在我尝试将列除以max_min向量之前,一切都是完美的。它似乎在每个专栏中都有效,但在年龄列中无效,但我似乎找不到原因。 我之前拆分了用于测试和训练的数据,下面我尝试扩展X_train数据。 # Working out the min value for each column and subtracting this from each row in the data
X_train_min = np.array(X_train0.min())
X_train0.sub(X_train_min.squeeze(), axis=1) 从上面的代码中,
我有一个熊猫数据框,里面填了这个:
import pandas.io.data as web
test = web.get_data_yahoo('QQQ')
在iPython中,数据帧如下所示:
In [13]: test
Out[13]:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 729 entries, 2010-01-04 00:00:00 to 2012-11-23 00:00:00
Data columns:
Open 729
给定A和B列:
A B
Small 3
Med 4
Med 1
Large 2
Small 1
假设我有数值X、Y和Z。我想创建一个新列,该列仅在列A的同一行中的条目是“小”时才输出列B和X的值的商。如果A列有"Med",我们除以Y,如果它有"Large",我们除以Z。它将继续逐行检查这一行。例如,在B列的第一行中,我们有'3',然后在A列的同一行中,我们有'Small',所以我们将输出3/X。因此,预期的列,让我们称之为C,将是:
C
3/X
4/Y
1/Y
2/
我有一些选项卡分隔的数据,如
a 5
b 4
c 3
d 2
e 1
我想规范第二列wrt中的值-- max值(max值是第一行中的值)。
a 1
b 0.8
c 0.6
d 0.4
e 0.2
我可以通过以下操作获得最大值(因为数据是按第二列中的值排序的)
max=cat values | head -1 | awk '{print $2}'
但是,我不知道剩下的命令是什么。有谁能帮我一下吗?
我有一个很大的数据集,但是,我确实有两列,一列用于权重,另一列用于权重单位,我确实想对权重列执行一些计算,但首先我想将它们全部转换为千克,因此有人可以帮助我如何检查单位列,如果我找到它的克数,我会将权重列值转换为千克:
下面是数据集的外观
import pandas as pd
# intialise data of lists.
data = {'Weghts':[2.00, 3.50, 2050.00, 4019.00],'weight_units':['Kilograms', 'kilograms', 'Gra
我是python的新手,在这里我有一个问题,我不知道如何解决,请帮助。
事情是这样的:我有一个dataframe,我想提取一个满足两个不同条件的列。
列如下所示:
state gender year name births
13299 AK F 2013 Emma 57
13300 AK F 2013 Sophia 50
13301 AK F 2013 Abigail 39
13302 AK F 2013 Isabella