首页
学习
活动
专区
工具
TVP
发布

皮皮鲁的AI星球

专栏作者
79
文章
179580
阅读量
34
订阅数
正则化:防止模型过拟合
为了避免过拟合,一种手段是使用正则化(Regularizaiton)来限制模型的复杂程度。Regularization从英文直译过来是“规则化”,就是说,在原来的问题求解条件上加一些规则限制,避免模型过于复杂,出现过拟合的情况。
PP鲁
2020-06-09
2.4K0
Logistic Regression:互联网行业应用最广的模型
我的网站公示显示效果更好,欢迎访问:https://lulaoshi.info/machine-learning/linear-model/logistic-regression.html
PP鲁
2020-06-02
5270
机器学习模型的容量、欠拟合和过拟合
我的网站公示显示效果更好,欢迎访问:https://lulaoshi.info/machine-learning/linear-model/underfit-overfit.html
PP鲁
2020-05-26
1.1K0
最大似然估计:从概率角度理解线性回归的优化目标
我的网站公式显示效果更好:https://lulaoshi.info/machine-learning/linear-model/maximum-likelihood-estimation.html,欢迎访问。
PP鲁
2020-05-26
1.4K0
线性回归的求解:矩阵方程和梯度下降、数学推导及NumPy实现
我的网站公式显示效果更好:https://lulaoshi.info/machine-learning/linear-model/minimise-loss-function.html,欢迎访问。
PP鲁
2020-05-26
1.9K0
机器学习 | 线性回归的数学表示
线性回归对已有数据进行建模,可以对未来数据进行预测。有些人觉得线性回归太过简单,甚至不屑于称之为机器学习;另外一些人觉得很多编程库已经对线性回归做了封装,使用时调用一下函数就好,不必了解太多数学推导过程。实际上,线性回归是所有机器学习技术的一个最好起点,很多复杂的机器学习技术以及当前大火的深度神经网络都或多或少基于线性回归。
PP鲁
2020-05-26
6170
斯坦福MacroBase:实时端到端的异常点检测和解释系统
本文和大家分享一个来自Stanford的开源大数据和机器学习系统:MacroBase。
PP鲁
2020-05-08
7230
机器学习 | K-Means聚类算法原理及Python实践
“聚类”(Clustering)试图将数据集中的样本划分为若干个不相交的子集,每个子集被称为一个“簇”或者“类”,英文名为Cluster。比如鸢尾花数据集(Iris Dataset)中有多个不同的子品种:Setosa、Versicolor、Virginica,不同品种的一些观测数据是具有明显差异的,我们希望根据这些观测数据将其进行聚类。
PP鲁
2020-04-24
1.4K0
信息时代,我们可能离真相越来越远。
之前的两年我一直在做新闻平台上的大数据分析和用户阅读行为研究,对于新闻资讯有一些了解和认识。本文想结合本次疫情谈谈我对新闻媒体的认识。
PP鲁
2020-03-26
1.2K0
2020已来,大数据和AI领域必须了解的六大趋势
包括阿里巴巴达摩院在内的全球顶级科研机构纷纷对2020年的科技行业做出了预测,过去的一年,大数据和AI行业继续蓬勃发展:
PP鲁
2020-01-13
6240
求职 | 想转行数据科学,收好岗位选择指南与技能图谱分析!
在大数据和人工智能行业,有众多与数据相关的岗位,名目繁多:数据分析师、数据产品经理、数据挖掘工程师、大数据工程师、数据开发工程师、机器学习工程师、算法工程师、NLP算法工程师、数据科学家等等。很多应届生或准备转行的朋友面对如此多的岗位名称,都会傻傻分不清楚。本文将这些数据相关的职位分为三类:数据分析师、大数据工程师和算法工程师,并从工作内容和技能要求来做一下分析,帮助新入行朋友选择适合自己的岗位。这里我暂且不谈最顶级的数据科学家,这部分人均为名校博士,全世界可能只有几千个,他们可以轻轻松松年薪百万,是整个食物链的最顶层。他们不需要找工作,都是工作在找他们。
PP鲁
2019-12-26
6740
GPU加速04:将CUDA应用于金融领域,使用Python Numba加速B-S期权估值模型
本文为英伟达GPU计算加速系列的第四篇,主要基于前三篇文章的内容,以金融领域期权估值案例来进行实战练习。前三篇文章为:
PP鲁
2019-12-26
1.7K0
机器学习必备 | 最大似然估计:从统计角度理解机器学习
本专栏之前的文章介绍了线性回归以及最小二乘法的数学推导过程。对于一组训练数据,使用线性回归建模,可以有不同的模型参数来描述数据,这时候可以用最小二乘法来选择最优参数来拟合训练数据,即使用误差的平方作为损失函数。机器学习求解参数的过程被称为参数估计,机器学习问题也变成求使损失函数最小的最优化问题。最小二乘法比较直观,很容易解释,但不具有普遍意义,对于更多其他机器学习问题,比如二分类和多分类问题,最小二乘法就难以派上用场了。本文将给大家介绍一个具有普遍意义的参数估计方法:最大似然估计。
PP鲁
2019-12-26
4.1K0
机器学习第一课 | 一文读懂线性回归的数学原理
线性回归对已有数据进行建模,可以对未来数据进行预测。有些人觉得线性回归太过简单,甚至不屑于称之为机器学习;另外一些人觉得很多编程库已经对线性回归做了封装,使用时调用一下函数就好,不必了解太多数学推导过程。实际上,线性回归是所有机器学习技术的一个最好起点,很多复杂的机器学习技术以及当前大火的深度神经网络都或多或少基于线性回归。
PP鲁
2019-12-26
6730
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档