前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >二手车交易价预测分析

二手车交易价预测分析

作者头像
用户6825444
发布2020-04-01 14:57:16
6450
发布2020-04-01 14:57:16
举报
文章被收录于专栏:木下学Python木下学Python
前言

上次我们爬取了五八二手车数据,文章链接:

《爬虫 | 五八字体反爬

获取的数据如下:

今天我们就用这份数据,根据新车报价,行驶里程,上牌时间,排量,变速箱,排放标准这些字段,对交易价做一个预测分析。

环境配置

1.Pandas 库用于读取和分析csv文本

2.Numpy 库用于一些基本的矩阵操作

3.TensorFlow 2.0 库用于创建一个小型的全 连接神经网络

4.Matplotlib 库用于绘图

5.Scikit-learn 库用于数据集切分

我们使用的库,环境是基于 anaconda 的,在其中安装,更换镜像安装可参考:

《Python 多环境搭建方法

更换镜像后直接 pip 安装即可。

start

小编使用的 jupyter notebook 环境。

通过 pd.read_csv 就可以读取一个 csv 文件,输出我们读取的 DataFrame。

使用head(5)来观察一下前5个样本的样子:

链接,交易地址,名称是不需要的,需要把他们删掉;同时排放标准,变速箱以及排量需要我们额外编码,把他们变成数字以便训练模型:

下一步就是定义一个模型,我们使用 tensorflow.keras 模型快速实现一个全连接层模型。

全连接网络可以学习数据之间的关联,用于对新的数据做出推断:

接下来开始训练,训练之前需要把数据进行一个归一化操作,就是减去均值再除以标准差,使我们的样本符合一个正态分布,更有益于损失函数的收敛:

使用 matplotlib 画出损失函数的图像,可以看到,训练过程中是持续下降的,没有出现震荡,说明此模型是可以使用的:

下图是预测测试集和真实值得对比:

上图的数据只显示了 20 条,基本都差在 2w 元以内,十分接近真实值了。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-03-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 木下学Python 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文件存储
文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档