1.TensorFlow环境搭建完工
2.把jupyter notebook 用起来
3.拓展:实践Python圈中的符号计算库-Sympy
4.继续对腾讯算法大赛进行项目研究
4.1 为进一步了解体会机器学习的流程,实践了两个微型精简项目(关于sklear提供的数据集iris)
4.2 特征工程在项目中举住轻重,由此本周还拜读了一篇有关于特征工程的优秀文章并实践了相关实例
具体内容整理于文档 关于TensorFlow的安装和心得
具体内容整理于文档 关于Jupyter notebook的安装以及一些使用心得
Sympy库提供了诸多符号计算的方法函数,如解方程、解方程组(二式二元一次方程组可以用一行代码解决)、函数赋值运算、求导数及偏导数、求积分、求极限的函数等等,十分实用,方便快捷!此处附上相关文档链接。
具体内容整理于文档 关于腾讯算法大赛
参考文档 scikit-learn-intro
项目一思路及步骤总结
1.抽取特征(萼宽,瓣长)
2.散点画图(x,y|萼宽,瓣长)完成直观分布
3.染色完成分类(染色分类依据每条记录对应的target属性值及其值对应的target_names,即何值何类何色)
补充:关于clim函数:matplotlib官方文档->docs->The Pyplot API->clim
项目一代码解析
项目一实现
项目二代码
项目二实现
参考文档 使用sklearn做单机特征工程
补充
1.哑编码实例:(参考于使用scikit-learn对数据进行预处理)
from sklearn.preprocessing import OneHotEncoder
2.连续型特征:相对于离散型特征而言
3.缺失值
5.关于lamda :python lambda的用法
6.关于filter对象的注意事项:filter函数