首页
学习
活动
专区
工具
TVP
发布

PPV课数据科学社区

专栏作者
2119
文章
2403062
阅读量
187
订阅数
快速选择合适的机器学习算法
本文主要适用于初学者到中级数据科学家或分析师,他们有兴趣识别和应用机器学习算法来解决他们感兴趣的问题。
小莹莹
2018-07-24
6030
数据科学家最常用的十大机器学习算法
在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而言之,它是指没有任何一种算法能在每个问题上都能有最好的效果,这个理论在监督学习方面体现得尤为重要。
小莹莹
2018-07-24
4910
数据咖小课堂:数据挖掘知识脉络与资源整理(八)–matlab
Matlab 1 简介 MATLAB 是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulin
小莹莹
2018-04-25
7630
常用推荐算法(50页干货)
内容主要围绕电商中用到的一些推荐算法,参考了Xavier Amatriain在CMU的Machine Learning暑期学校上的讲授的内容。 PS:建议阅读方式——点击图片,横屏阅读 来源:阿里技术
小莹莹
2018-04-25
1.3K0
大数据在营销和销售中的十大应用
本文旨在给为大数据革命性改变市场营销和销售的众多趋势做一个概述, 其中综合了十个有关报告,介绍了十个大数据在如今的市场营销和销售策略中的应用。其中增长很快的一个领域就是定价:管理价格以及通过销售网络传播和优化定价。在有大数据算法和先进的分析技术的今天,为给定的产品或服务实现价格优化越来越不在话下。就连在不是那么有弹性的大宗商品驱动行业中,简化日常定价决策也已经是非常常见的了。 ◆ ◆ ◆ 大数据对市场营销和销售的巨大贡献   当前大数据可以辅助销售的方面包括:提高潜在客户的质量,提高销售机会数据的质量,提
小莹莹
2018-04-25
3K0
AI时代就业指南:数据挖掘工程师成长之路
编者按:数联寻英发布的首份《大数据人才报告》显示,目前全国大数据人才只有46万,未来3到5年人才缺口达150万之多。 今年3月份时,谷歌开发的人工智能AlphaGo打败了全球最顶尖的围棋高手,轰动全世界,AI时代正式拉开序幕。实际上,人工智能这一概念早在上世纪一大批科幻小说陆续发表时,就已被人们接受,而随着科技的发展,人工智能的发展前景更是日益清晰。一个人工智能的诞生需要无数个工程师挥洒汗水。其中,负责开发学习算法、使机器能像人类一样思考问题的数据挖掘工程师更是无比重要。什么人能完成人工智能的开发
小莹莹
2018-04-24
8050
什么是最大似然估计、最大后验估计以及贝叶斯参数估计
假如你有一个硬币。你把它投掷 3 次,出现了 3 次正面。下一次投掷硬币正面朝上的概率是多少? 这是一个从数据中估计参数的基础机器学习问题。在这种情况下,我们要从数据 D 中估算出正面朝上 h 的概率
小莹莹
2018-04-24
1.2K0
数据驱动决策的13种思维
“数据驱动决策”,为了不让这句话成为空话,请先装备以下13种思想武器,相信将来你一定能用上! 第一、信度与效度思维 这部分也许是全文最难理解的部分,但我觉得也最为重要。没有这个思维,决策者很有可能在
小莹莹
2018-04-24
1.2K0
推荐系统算法初探
1. 序言 最近因为PAC平台自动化的需求,开始探坑推荐系统。这个乍一听去乐趣无穷的课题,对于算法大神们来说是这样的: 而对于刚接触这个领域的我来说,是这样的: 在深坑外围徘徊了一周后,我整理了一些
小莹莹
2018-04-24
9370
【算法】什么是神经网络?
本文结构: 什么是神经网络 什么是神经元 神经网络的计算和训练 代码实现 1. 什么是神经网络 神经网络就是按照一定规则将多个神经元连接起来的网络 例如全连接(full connected, FC)神经网络,它的规则包括: 有三种层:输入层,输出层,隐藏层。 同一层的神经元之间没有连接。 full connected的含义:第 N 层的每个神经元和第 N-1 层的所有神经元相连,第 N-1 层神经元的输出就是第 N 层神经元的输入。 每个连接都有一个权值。 不同的神经网络,具有不同的连接规则 2. 什么
小莹莹
2018-04-24
1.4K0
diRblo|中文文本分析方便工具包chinese.misc简介(附文本样例)
现在NLP技术那么发达了,各种工具那么NB了,可是用R做文本分析的人居然还得为如何读文件不乱码、如何分词、如何统计词频这样的事犯难,也是醉了。如果老停留在这个水平上,那各位亲你们离自己整天挂在嘴边儿的大数据机器学习之类的基本上就无缘了。所以希望大家能把更多精力放到算法上,而不是用在一些琐碎、浪费时间又极其恼人的事情上。 其实像文本清理这种活儿,基本上就应该是用鼠标点吧点吧就能自动完成的,若要还费半天劲的话纯属扯淡。 所以,chinese.misc这个R包就要来完成这个任务。 chinese.misc
小莹莹
2018-04-24
1K0
轻松看懂机器学习十大常用算法
来源:不会停的蜗牛 链接:http://www.jianshu.com/p/55a67c12d3e9 通过本篇文章大家可以对ML的常用算法形成常识性的认识。没有代码,没有复杂的理论推导,仅是图解,介绍这些算法是什么以及如何应用(例子主要是分类问题)。以后有机会再对单个算法做深入地解析。 今天的算法如下: 决策树 随机森林算法 逻辑回归 SVM 朴素贝叶斯 K最近邻算法 K均值算法 Adaboost 算法 神经网络 马尔可夫 1. 决策树 根据一些 feature 进行分类,每个节点提一个问题,通过判断,将
小莹莹
2018-04-24
6770
ECharts又搞大动作!3.5 版本提供更多数据可视化图表
在 echarts 新发布的 3.5 版本中,新增了日历坐标系,增强了坐标轴指示器。同时,echarts 统计扩展 1.0 版本发布了。日历坐标系用于在日历中绘制图表,坐标轴指示器方便用户观察数据内容,统计扩展是一个专门用来进行数据分析的工具。 统计扩展 统计扩展是一个专门用来进行数据分析的工具,目前主要包含了二维的回归、多维的聚类以及一些常用的统计功能。 扩展中的回归算法不仅包含了常用的线性回归,还包含了指数回归、对数回归、以及多项式回归。 线性回归的示例: 对数回归的示例: 秉承了可视分析的
小莹莹
2018-04-24
1.9K0
Apriori算法介绍(Python实现)
导读: 随着大数据概念的火热,啤酒与尿布的故事广为人知。我们如何发现买啤酒的人往往也会买尿布这一规律?数据挖掘中的用于挖掘频繁项集和关联规则的Apriori算法可以告诉我们。本文首先对Apriori算法进行简介,而后进一步介绍相关的基本概念,之后详细的介绍Apriori算法的具体策略和步骤,最后给出Python实现代码。 1.Apriori算法简介 Apriori算法是经典的挖掘频繁项集和关联规则的数据挖掘算法。A priori在拉丁语中指”来自以前”。当定义问题时,通常会使用先验知识或者假设,这被称作
小莹莹
2018-04-24
1.7K0
三张图读懂机器学习 :基本概念、五大流派与九种常见算法
机器学习正在进步,我们似乎正在不断接近我们心中的人工智能目标。语音识别、图像检测、机器翻译、风格迁移等技术已经在我们的实际生活中开始得到了应用,但机器学习的发展仍还在继续,甚至被认为有可能彻底改变人类文明的发展方向乃至人类自身。但你了解现在正在发生的这场变革吗?四大会计师事务所之一的普华永道(PwC)近日发布了多份解读机器学习基础的图表,其中介绍了机器学习的基本概念、原理、历史、未来趋势和一些常见的算法。为便于读者阅读,机器之心对这些图表进行了编译和拆分,分三大部分对这些内容进行了呈现,希望能帮助你进一步阅
小莹莹
2018-04-24
1.6K0
进阶篇:从 0 到 1 掌握 Python 机器学习(附资源)
进阶篇 机器学习算法 本篇是使用 Python 掌握机器学习的 7 个步骤系列文章的下篇,如果你已经学习了该系列的上篇基础篇:从 0 到 1 掌握 Python 机器学习(附资源),那么应该达到了令人
小莹莹
2018-04-24
8630
28页PPT详解腾讯数据挖掘体系及应用
导读 本文主要是腾讯高级数据分析师彭远权详解腾讯数据挖掘体系及应用,28页PPT的阐述了:数据工作是做什么的?数据理念和原则、数据体系架构、数据实战中DBScan算法在LBS上的应用等等。 END.
小莹莹
2018-04-24
1.2K0
机器学习入门阶段易犯的 5 个错误
怎样进入机器学习领域没有定式。我们的学习方式都有些许不同,学习的目标也因人而异。 但一个共同的目标就是要能尽快上手。 如果这也是你的目标,那么这篇文章为你列举了程序员们在通往机器学习高手道路上常见的五种错误。 1. 将机器学习看得高不可攀 机器学习不过是另一堆技术的集合,你可以用它来解决复杂问题。这是一个飞速发展的领域,因此,机器学习的学术交流一般出现在学术期刊及研究生的课本里,让它看起来高不可攀又难于理解。 要想高效掌握机器学习,我们需要转变观念,从技术转到方法,由精确变为“足够好”,这也同样适用于程
小莹莹
2018-04-24
6550
聚类分析:k-means和层次聚类
尽管我个人非常不喜欢人们被划分圈子,因为这样就有了歧视、偏见、排挤和矛盾,但“物以类聚,人以群分”确实是一种客观的现实——这其中就蕴含着聚类分析的思想。 前面所提到的机器学习算法主要都是分类和回归,这两类的应用场景都很清晰,就是对分类型变量或者数值型变量的预测。聚类分析是一种根据样本之间的距离或者说是相似性(亲疏性),把越相似、差异越小的样本聚成一类(簇),最后形成多个簇,使同一个簇内部的样本相似度高,不同簇之间差异性高。 有人不理解分类和聚类的差别,其实这个很简单:分类是一个已知具体有几种情况的变量,
小莹莹
2018-04-24
2K0
入门 | 解读分类算法与聚类算法
学习数据挖掘的朋友,对分类算法和聚类算法都很熟悉。无论是分类算法还是聚类算法,都有许多具体的算法来实现具体的数据分析需求。很多时候,我们难以判断选择分类或者聚类的场合是什么。我们最直观的概念是,分类和聚类都是把某个被分析的对象划分到某个类里面,所以觉得这两种方法实际上是差不多一回事。然而当我们学习了许多具体算法之后再回来看,分类和聚类所实现的数据分析功能实际上是大相径庭的,他们之间不仅仅有算法上的具体差异,更重要的是,甚至他们的应用领域和所解决的具体问题都不一样。 1. 类别是否预先定义是最直观区别 算
小莹莹
2018-04-24
2.1K0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档