首页
学习
活动
专区
工具
TVP
发布

AI派

公众号:AI派,致力于分享机器学习相关知识,让机器学习更加平民化!
专栏作者
207
文章
268327
阅读量
55
订阅数
你可能过于高估了机器学习算法能力,带你解读鲜为人知的数据泄露问题
读完分类与回归算法的评估指标、排序算法的评估指标以及机器学习模型的离线评估方法之后,你已经知道了在机器学习中的该使用什么指标来评估模型以及使用什么方法来评估模型,但是在现实生活中评估模型时经常会遇到一个问题:数据泄露(data leakage),这里我们来对数据泄露做一个解读。
abs_zero
2018-12-21
3.2K0
matplotlib秘技:让可视化图形动起来
Python的matplotlib和seaborn是非常好用的绘图库。但它们创建的都是静态图像,难以通过动态、美观的方式描述数据值的变化。如果你的下一次演示或者下一篇博客文章,能用动态图形展示数据的发展,该有多好?更妙的是,你可以继续使用matplotlib、seaborn或者其他你喜欢用的库。
abs_zero
2018-12-17
1.3K0
业界 | 如何达到Kaggle竞赛top 2%?这里有一篇特征探索经验帖
在数值数据上构建任意监督学习模型的一个重要方面是理解特征。查看模型的部分依赖图可帮助理解任意特征对模型输出的影响。
abs_zero
2018-12-13
3640
业界 | 四大机器学习编程语言对比:R、Python、MATLAB、Octave
GitHub 地址:https://github.com/mjbahmani/10-steps-to-become-a-data-scientist
abs_zero
2018-12-07
1.4K0
一份机器学习模型离线评估方法的详细手册
读完分类与回归算法的评估指标以及排序算法的评估指标之后,你已经知道了机器学习中分类、回归以及排序算法相关的评估指标。在这篇给大家介绍一些机器学习中离线评估模型性能的一些方法。
abs_zero
2018-12-06
1.3K0
5个原因告诉你:为什么在成为数据科学家之前,“逻辑回归”是第一个需要学习的
来源 | https://towardsdatascience.com/5-reasons-logistic-regression-should-be-the-first-thing-you-learn-when-become-a-data-scientist-fcaae46605c4
abs_zero
2018-10-23
3860
[Python爬虫]中国新说唱 Skr~ Skr~
https://mp.weixin.qq.com/s/IiLGk1qk9IXv6XD96GODcg
abs_zero
2018-10-23
6650
一份非常全面的机器学习分类与回归算法的评估指标汇总
读完机器学习算法常识之后,你已经知道了什么是欠拟合和过拟合、偏差和方差以及贝叶斯误差。在这篇给大家介绍一些机器学习中离线评估模型性能的一些指标。
abs_zero
2018-10-23
2K0
机器学习中你不可不知的几个算法常识
读完 机器学习基础 之后,你已经知道了到底什么是机器学习以及机器学习的学习任务。在这篇给大家介绍一些机器学习中必须要了解的几个算法常识,这些算法常识在之后从事机器学习方面研究和工作时是非常重要的。
abs_zero
2018-10-23
5880
【Github 5K星】BAT头条滴滴小米等笔试面经+深度学习/算法/NLP资源汇总!
最近,在GitHub上有位id为imhuay的热心人带头建立了一个关于国内知名互联网企业笔试和面试经验的资源库,光从名称上就能看出其内容有多丰富:《2018/2019/校招/春招/秋招/算法/机器学习(MachineLearning)/深度学习(Deep Learning)/自然语言处理(NLP)/C/C++/Python/面试笔记》。
abs_zero
2018-10-23
8640
一文掌握机器学习算法工程师技术栈
成为一名合格的开发工程师不是一件简单的事情,需要掌握从开发到调试到优化等一系列能力,这些能力中的每一项掌握起来都需要足够的努力和经验。
abs_zero
2018-10-23
1.1K0
今天免的高速费,以后都会让你交回来
遵循往年惯例,今年国庆黄金周期间,收费公路对小型客车免费。政策利好刺激下,车流、人流井喷式暴增,高速拥堵与景区爆棚已经可以预见。
abs_zero
2018-10-23
3520
Pandas可视化详解 | 轻松玩转Pandas(12)
数据分析的结果不仅仅只是你来看的,更多的时候是给需求方或者老板来看的,为了更直观地看出结果,数据可视化是必不可少的一个环节。这里带大家来看下一些常用的图形的画法。
abs_zero
2018-09-25
2.6K0
骚操作,用SQL方式的去玩Pandas
Pandas是一个非常方便的数据处理、数据分析的类库,在 人人都是数据分析师,人人都能玩转Pandas 这篇文章中,我将Pandas进行了一个系统的梳理。
abs_zero
2018-09-25
1.2K0
我数学不好,还能如何入门机器学习嘛?
我们知道,机器学习的特点就是:以计算机为工具和平台,以数据为研究对象,以学习方法为中心;是概率论、线性代数、数值计算、信息论、最优化理论和计算机科学等多个领域的交叉学科。尽管机器学习和深度学习有巨大的发展潜力,但要深入掌握算法的内部工作原理并获得良好的结果,就必须透彻地了解许多技术的数学原理。但是,据我观察,一些人缺乏必要的数学直觉和框架,无法获得有用的结果。如果你真的想成为一名人工智能人才,必须要严格自律,拿出很大一块时间投入到学习数学中。
abs_zero
2018-09-25
1.5K0
人人都是数据分析师,人人都能玩转Pandas
主要讲解了Pandas中常用的数据结构 Series 和 DataFrame 的用法。
abs_zero
2018-09-25
3420
Pandas基本功能详解 | 轻松玩转Pandas(2)
在 Pandas数据结构详解 | 轻松玩转Pandas(1) 介绍了 Pandas 中常用的两种数据结构 Series 以及 DataFrame,这里来看下这些数据结构都有哪些常用的功能。
abs_zero
2018-07-25
1.8K0
Pandas数据结构详解 | 轻松玩转Pandas(1)
Pandas 有很多高级的功能,但是想要掌握高级功能前,需要先掌握它的基础知识,Pandas 中的数据结构算是非常基础的知识之一了。
abs_zero
2018-07-25
6880
矩阵分解如何解决隐式反馈(预测用户行为)
简单回归下矩阵分解,矩阵分解要做的事情就是将用户评分矩阵分解为两个矩阵,一个矩阵表示用户偏好的隐因子向量,另一个矩阵表示物品主题的隐因子向量。矩阵分解的关键就是求解分解的两个矩阵。普通的矩阵分解只能解决用户的显式反馈,简单来说就是用户评分数据,但现实中推荐系统更多的是预测用户行为,如何使用矩阵分解来预测用户行为呢?
abs_zero
2018-07-25
2.4K0
【实战】Java如何跨语言调用Python/R训练的模型
在 如何使用sklearn进行在线实时预测(构建真实世界中可用的模型) 这篇文章中,我们使用 sklearn + flask 构建了一个实时预测的模型应用。无论是 sklearn 还是 flask,都是用 Python 编写的,在工业界,我们经常会使用 Python 或 R 来训练离线模型, 使用 Java 来做在线 Web 开发应用,这就涉及到了使用 Java 跨语言来调用 Python 或 R 训练的模型。很明显,之前方式就无法满足要求了。
abs_zero
2018-07-25
5.2K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档