首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

干货分享|如何用“Pandas”模块来做数据的统计分析!!

pd.read_csv("Churn_Modelling.csv") marketing = pd.read_csv("DirectMarketing.csv") 我们先从一个简单的例子着手来看, customer[['Geography...','Gender','EstimatedSalary']].groupby(['Geography','Gender']).mean() ?...这一类的预估工资的平均值达到了99564欧元,“男性”达到了100174欧元 当然除了求平均数之外,我们还有其他的统计方式,比如“count”、“min”、“max”等等,例如下面的代码 customer[['Geography...','Gender','EstimatedSalary']].groupby(['Geography','Gender']).agg(['mean','count','max']) ?...当然我们也可以对不同的列采取不同的统计方式方法,例如 customer[['Geography','EstimatedSalary','Balance']].groupby('Geography').agg

78620

Python中用PyTorch机器学习神经网络分类预测银行客户流失模型|附代码数据

类似地,Geography和Gender是分类列,因为它们含有分类信息,如客户的位置和性别。有几列可以视为数字列和类别列。例如,该HasCrCard列的值可以为1或0。...其中列的其余部分,Geography,Gender,HasCrCard,和IsActiveMember列可以被视为类别列。让我们创建这些列的列表:除该列外,其余所有列均可视为数字列。...例如,让我们绘制列的前五行,Geography并输出前五行的代码值:输出: 0 France1 Spain2 France3 France4 SpainName: Geography...例如,在该Geography列中,我们看到法国用0表示,德国用1表示。我们可以使用这些值来训练我们的模型。但是,更好的方法是以N维向量的形式表示分类列中的值,而不是单个整数。...例如,对于该Geography列,唯一值的数量为3。该Geography列的相应嵌入大小将为3/2 = 1.5 = 2(四舍五入)。

1.1K20

Python中用PyTorch机器学习分类预测银行客户流失模型

类似地,Geography和Gender是分类列,因为它们含有分类信息,如客户的位置和性别。有几列可以视为数字列和类别列。例如,该HasCrCard列的值可以为1或0。...其中列的其余部分,Geography,Gender,HasCrCard,和IsActiveMember列可以被视为类别列。让我们创建这些列的列表: 除该列外,其余所有 列均可视为数字列。...例如,让我们绘制列的前五行,Geography并打印前五行的代码值: 输出: 0 France1 Spain2 France3 France4 SpainName: Geography...例如,在该Geography列中,我们看到法国用0表示,德国用1表示。我们可以使用这些值来训练我们的模型。但是,更好的方法是以N维向量的形式表示分类列中的值,而不是单个整数。...例如,对于该Geography列,唯一值的数量为3。该Geography列的相应嵌入大小将为3/2 = 1.5 = 2(四舍五入)。

2.3K11

Python中用PyTorch机器学习神经网络分类预测银行客户流失模型|附代码数据

类似地,Geography和Gender是分类列,因为它们含有分类信息,如客户的位置和性别。有几列可以视为数字列和类别列。例如,该HasCrCard列的值可以为1或0。...其中列的其余部分,Geography,Gender,HasCrCard,和IsActiveMember列可以被视为类别列。让我们创建这些列的列表:除该列外,其余所有列均可视为数字列。...: Geography, dtype: category Categories (3, object): [France, Germany, Spain] 以下脚本在该列的前五行中绘制了值的代码Geography...例如,在该Geography列中,我们看到法国用0表示,德国用1表示。我们可以使用这些值来训练我们的模型。但是,更好的方法是以N维向量的形式表示分类列中的值,而不是单个整数。...例如,对于该Geography列,唯一值的数量为3。该Geography列的相应嵌入大小将为3/2 = 1.5 = 2(四舍五入)。

1.3K00

如何用 Python 和 Tensorflow 2.0 神经网络分类表格数据?

RowNumber:行号,这个对于模型没用,忽略 CustomerID:用户编号,这个是顺序发放的,忽略 Surname:用户姓名,对流失没有影响,忽略 CreditScore:信用分数,这个很重要,保留 Geography...先看看都有哪些列: categorical_columns = ['Geography', 'Gender', 'HasCrCard', 'IsActiveMember'] Geography:用户所在国家...例如 Geography 包含了国家/地区名称。如果你把法国指定为1, 德国指定为2,电脑可能自作聪明,认为“德国”是“法国”的2倍,或者,“德国”等于“法国”加1。这显然不是我们想要表达的。...colname, train[colname].unique().tolist()) return feature_column.indicator_column(categorical) 我们尝试输入 Geography...geography = get_one_hot_from_categorical('Geography'); geography ? 观察结果,测试通过。

77730
领券