有趣的Python和你-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

有趣的Python和你

专栏成员

208

文章

187943

阅读量

55

订阅数

Python有趣|中文文本情感分析

机器学习神经网络深度学习人工智能 python

前文给大家说了python机器学习的路径，这光说不练假把式，这次，罗罗攀就带大家完成一个中文文本情感分析的机器学习项目，今天的流程如下：

2019-04-09

2.7K0

Python有趣|机器学习应该这样学

python 编程算法机器学习神经网络

我不知道大家要花多长时间学习机器学习？前文我们已经介绍的Python爬虫和数据分析的知识，如果只是做入门，平均每门一个月，问题也是不大的；但大部分觉得机器学习很难学，需要很好的数学基础，现在毕业那么久，看到数学公式就晕，机器学习可能从入门直接到放弃，花很长时间都学不会。

2019-04-09

5450

深度学习|Keras识别MNIST手写数字（CNN）

卷积神经网络机器学习神经网络深度学习人工智能

今天继续使用MNIST数据。方法：这次使用的方法为卷积神经网络（CNN）。卷积神经网络通过卷积层，池化层来做特征的提取，最后再连上全连接网络。

2019-02-22

1.4K0

机器学习实战之决策树

机器学习决策树编程算法

决策树的算法可谓是贴近我们的生活，通过下面的案例，你就会发现我们每天都在有意无意的使用着决策树算法（好厉害的样子）。小明同学每天早上都要去学校，可步行、乘公交和坐隔壁老王叔叔的车（皮一下很开心）。

2018-07-03

3820

机器学习实战之朴素贝叶斯

机器学习决策树编程算法

在学习朴素贝叶斯分类模型之前，我们回顾一下之前学习的KNN和决策树，读者本人的总结：不同的机器学习方法有着不同的假设和理论进行支撑，而这些假设和理论在很大程度上体现了该算法的优缺点。 KNN：在样本空间中，相同的类型数据在空间呈聚集状态，也就是距离会靠近，基于这个假设，只需要对测试样本与训练样本进行距离计算，最近距离的样本的类别很大程度上就是测试样本的类别。决策树：基于信息理论。样本数据是混乱的（熵高），但好在有特征这个东西，如何有效利用特征让样本不混乱，可分，这就是决策树需要完成的事情。而今天介

2018-07-03

5020

机器学习实战之Logistic回归

机器学习编程算法

写在前面 Logistic回归涉及到高等数学，线性代数，概率论，优化问题。本文尽量以最简单易懂的叙述方式，以少讲公式原理，多讲形象化案例为原则，给读者讲懂Logistic回归。如对数学公式过敏，引发不适，后果自负。 Logistic回归原理与推导 Logistic回归中虽然有回归的字样，但该算法是一个分类算法，如图所示，有两类数据（红点和绿点）分布如下，如果需要对两类数据进行分类，我们可以通过一条直线进行划分（w0 * x0 + w1 * x1+w2 * x2）。当新的样本（x1,x2）需要预测时，带入直线

2018-07-03

2710

机器学习实战之树回归

机器学习线性回归决策树编程算法

“回归”与“树” 在讲解树回归之前，我们看看回归和树巧妙结合的原因。线性回归的弊端线性回归需要拟合所有样本点，在特征多且特征关系复杂时，构建全局模型的想法就显得太难。实际生活中，问题很大程度上不是线性的，而是非线性的，所以线性回归的很容易欠拟合。传统决策树弊端与改进决策树可以解决数据的非线性问题，而且直观易懂，是否可以通过决策树来实现回归任务？我们来回顾下之前讲过的决策树方法，其在划分子集的时候使用的方法是信息增益（我们也叫ID3方法），其方法只针对标称型（离散型）数据有效，很难用于回归；而且

2018-07-03

4810

sklearn调包侠之无敌小抄

scikit-learn python 机器学习编程算法

scikit-learn（以下简称为sklearn）是用Python开发的机器学习库，其中包含大量机器学习算法、数据集，是数据挖掘方便的工具。本教程参考《Python机器学习及实战》、《scikit-learn机器学习》和sklearn的官方文档，详细讲解如何使用sklearn实现机器学习算法。首先，依旧讲讲写本系列教程的原因：第一，相比于直接编写各种算法，sklearn简单容易上手；第二，参考书籍有些部分讲解不细致，sklearn版本的更新，官方文档虽然齐全，但是是英文等等，希望通过编写这个教程，可以让读

2018-07-03

9480

机器学习实战之主成分分析（PCA）

机器学习大数据存储编程算法

如果人类适应了三维，去掉一个维度，进入了二维世界，那么人类就会因为缺少了原来所适应的一个维度，而无法生存。 ——《三体》在许多科幻电影中，有许多降维的例子。在《十万个冷笑话2》（可能只有萌新看过）中，大boss将主角降维到二维，就成了纸片人，进而失去了战斗能力；降维到一维，就变成了线条，这就是降维打击。说直白点，降维就是将维度降低。在机器学习中，降维常常用来做数据的预处理。为什么要对数据进行降维了？那来从数据本身说起。大数据时代，数据冗余，维度高。例如

2018-07-03

3610

机器学习实战之K-Means聚类

机器学习编程算法监督学习

俗话说的好：“物以类聚，人以群分”，今天我们要讲的聚类算法很大程度上可以印证此话。聚类是一种非监督学习，什么是非监督学习？与之前学习的分类和回归不同（监督学习），监督学习是有有label标签的，而非监督学习没有。我们再回到聚类上，聚类是把相似的对象归到同一簇中，有点像全自动分类。聚类的应用场景有很多，例如在电商行业，通过用户的购买历史进行聚类，针对不同的用户群体推送不同的广告。 K-Means聚类算法算法流程 K-Means聚类首先随机确定 K 个初始点作为质心（这也是K-Means聚类的一个问题，这

2018-07-03

3900

sklearn调包侠之逻辑回归

编程算法机器学习

算法原理传送门：机器学习实战之Logistic回归正则化这里补充下正则化的知识。当一个模型太复杂时，就容易过拟合，解决的办法是减少输入特征的个数，或者获取更多的训练样本。正则化也是用来解决模型过拟合的一种方法。常用的有L1和L2范数做为正则化项。 L1范数 L1范数作为正则化项，会让模型参数θ稀疏话，就是让模型参数向量里为0的元素尽量多。L1就是在成本函数后加入: L2范数而L2范数作为正则化项，则是让模型参数尽量小，但不会为0，即尽量让每个特征对预测值都有一些小的贡献。L2就是在成本函数后加入

2018-07-03

8100

机器学习实战之树回归

机器学习线性回归决策树编程算法

我们来回顾下之前讲过的决策树方法，其在划分子集的时候使用的方法是信息增益（我们也叫ID3方法），其方法只针对标称型（离散型）数据有效，很难用于回归；而且ID3算法切分过于迅速，容易过拟合，例如：一个特征有4个值，数据就会被切为四份，切分过后的特征在后面的过程中不再起作用。

2018-06-24

3230

机器学习实战之朴素贝叶斯

机器学习决策树编程算法

在学习朴素贝叶斯分类模型之前，我们回顾一下之前学习的KNN和决策树，读者本人的总结：不同的机器学习方法有着不同的假设和理论进行支撑，而这些假设和理论在很大程度上体现了该算法的优缺点。

2018-06-24

3720

机器学习实战之决策树

机器学习决策树编程算法

决策树的算法可谓是贴近我们的生活，通过下面的案例，你就会发现我们每天都在有意无意的使用着决策树算法（好厉害的样子）。

2018-06-24

4680

机器学习实战之KNN算法

机器学习编程算法 python 爬虫

本系列教程为《机器学习实战》的读书笔记。首先，讲讲写本系列教程的原因：第一，《机器学习实战》的代码由Python2编写，有些代码在Python3上运行已会报错，本教程基于Python3进行代码的修订；第二：之前看了一些机器学习的书籍，没有进行记录，很快就忘记掉了，通过编写教程也是一种复习的过程；第三，机器学习相对于爬虫和数据分析而言，学习难度更大，希望通过本系列文字教程，让读者在学习机器学习的路上少走弯路。

2018-06-24

6020

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态