首页
学习
活动
专区
工具
TVP
发布

数据森麟

专栏作者
341
文章
408547
阅读量
39
订阅数
魔性,用Python实现火爆全网的「蚂蚁呀嘿」视频特效!
https://aistudio.baidu.com/aistudio/projectdetail/1586056
数据森麟
2021-03-09
6780
AI产品经理的入门必修课(2)——实战篇
上一篇文章里简单介绍了AI产品经理需要具备的能力和对数据、算法需要理解的程度。本篇计划介绍一下机器学习的实际训练过程,来进一步的理解AI产品在日常工作中需要关注的内容。现简单的将训练流程划分为:定位要解决的任务类型 -> 选择合适的算法模型 -> 准备数据集 -> 训练模型 -> 调整参数 -> 模型评估及验收。
数据森麟
2021-01-25
4820
统计学关我什么事?
最近,我正在读《统计学关我什么事》这本书,副标题是:生活中的极简统计学,作者小岛宽之,是日本的经济学博士,知名的数学随笔作家。
数据森麟
2021-01-25
5670
AI产品经理的入门必修课——案例篇(1)
前面介绍了「AI产品经理需要具备的能力和对数据、算法需要理解的程度」、「机器学习的实际训练过程」,后面将围绕AI产品在当前环境下的热门应用来进行探讨,涵盖了语音识别、图像识别、NLP自然语言处理、知识图谱等产品化落地的场景。
数据森麟
2021-01-25
6790
贝叶斯(下)—实战项目
在sklearn 中提供的贝叶斯分类算法有三种,分别是:高斯朴素贝叶斯(GaussianNB)、多项式朴素贝叶斯(MultinomialNB)和伯努利朴素贝叶斯(BernoulliNB)
数据森麟
2020-12-08
4450
从0开始实现一个Adaboost分类器(完整代码)
日前,通俗易懂的推导了三种集成学习的原理及主要公式,今天本文基于Python从0开始手动实现一个Adaboost分类器,文中提供完整代码。
数据森麟
2020-12-08
1.7K0
机器学习 | 决策树理论知识(一)
决策树模型呈树状结构,是以实例为基础的归纳学习,它的每个非叶子节点存储的是用于分类的特征,其分支代表这个特征在某个值上的输出,而每个叶子节点存储的就是最终的类别信息,可以认为是if-then规则的集合。简而言之,利用决策树进行预测的过程就是从根节点开始,根据样本的特征属性选择不同的分支,直到到达叶子结点,得出预测结果的过程。决策树学习采用的是自顶向下的递归方法,其基本思想是以信息熵为度量构造一棵熵值下降最快的树,到叶子节点处的熵值为零,此时每个叶节点中的实例都属于同一类。其主要优点是模型具有可读性、分类速度快、只需一次构建,可反复使用。
数据森麟
2020-11-23
7550
「双非」研究生数据分析春招心路历程。
今天邀请了一位小姐姐舒梦做了春招DA岗位面经分享,文章经授权首发于公众号「数据管道」,以下为作者自述全文,希望对正在求职数据分析或准备跨行数据分析的朋友有些许帮助。
数据森麟
2020-02-20
1K0
如何评价算法的好坏?
评价一个算法的好坏,我认为关键是看能不能解决问题。如果算法能很好地解决实际的问题,那么我认为就是好算法。比如预测的算法,关键是看预测的准确率,即预测值与实际值之间的接近程度,而不是看算法本身的评分高低。
数据森麟
2019-11-27
8530
基于大数据的推荐算法综述
致力于为机器学习、深度学习、数据挖掘等AI技术的“初学者”或者“爱好者”,进行基础理论与实战技能的介绍和学习。我们团队成员既有各个著名院校的在校硕士生、博士生,也有BAT一线资深工程师,我们会竭诚为您服务!
数据森麟
2019-10-17
2.8K0
随机森林算法梳理
首先来说一下集成学习。集成学习在学术界和工业界都有很高的热度,例如Kaggle竞赛中神挡杀神佛挡杀佛的XGBoost就是一个典型的例子。那么什么是集成学习?最通俗易懂的理解就是:"三个臭皮匠,顶个诸葛亮"。把"臭皮匠"组合起来,其决策能力可能超过"诸葛亮"。
数据森麟
2019-10-12
9850
哪种 Python 程序员最赚钱?
本文是春节经典文章回顾专题第一弹。转载自简说Python,作者XksA,详情可以扫描下方二维码关注该公众号
数据森麟
2019-09-27
5670
数据科学大佬的简历上都有哪些技能?
如果你是一个数据科学的求职者,那么你一定想知道在你的简历上应该写些什么技能会有更大的概率接到面试。如果你想进入这个领域,你可能已经多次想要知道哪些技术可以成为一个有吸引力的候选人。
数据森麟
2019-09-27
5220
想要在互联网公司AI 岗位校招中脱颖而出,听听面试官怎么说
作为京东集团2019秋招的一名算法岗面试官,来为大家解读一下如何在AI领域的校招中脱颖而出。
数据森麟
2019-09-27
3880
精选|2018年7月R新包推荐
7月份,大约有251个R新包收录于CRAN。除7月份新包数量远超6月份之外,R新包的质量和多样性上也有明显的进步。比如tropicalSparse,抽象数学研究与分析;eChem,分析化学方向的研究应用。
数据森麟
2019-09-27
8960
秋招季,用Python分析深圳程序员工资有多高?
多图预警、多图预警、多图预警。秋招季,毕业也多,跳槽也多。我们的职业发展还是要顺应市场需求,那么各门编程语言在深圳的需求怎么呢?工资待遇怎么样呢?zone 在上次写了这篇文章之后 用Python告诉你深圳房租有多高 ,想继续用 Python 分析一下,当前深圳的求职市场怎么样?顺便帮一下秋招的同学。于是便爬取了某拉钩招聘数据。以下是本次爬虫的样本数据:
数据森麟
2019-09-27
4900
统计思维如何帮助大数据应用从人工走向智能?(下)
欢迎各位同学回来,本文承接上周发表的文章:统计思维如何帮助大数据应用从人工走向智能?(上),感兴趣的同学可以去了解下。
数据森麟
2019-09-27
5990
统计思维如何帮助大数据应用从人工走向智能?(上)
2018年8月9日(上周四),笔者和金融科技业务部的几位算法同事有幸参加了哥伦比亚大学全球中心举办的人工智能系列论坛。本次论坛邀请了哥伦比亚大学数据科学研究所副所长、哥伦比亚大学统计学郑甜教授(也是笔者在哥大Master期间的Advisor),分享哥大经典的统计思维研究及其对大数据分析、人工智能应用的启发。
数据森麟
2019-09-27
6090
数据驱动运营决策-框架与方法(下)
回到我们日常面对的工作,目前很火的 增长 这个话题,本质上就是数据驱动的市场营销方法,讨论一个公司如何通过渠道数据分析来提升获客的能力,就是一个典型的围绕 g(需求量)开展的工作。而平台的众多机器学习模型更多体现在后者,u(匹配效率):搜索、推荐、分单调度、前端产品、识别预测类、单量预测类、行为预测类,我们利用算法来做高效、个性化的匹配:在给定供给和需求规模的情况下,尽可能提升订单转化率。
数据森麟
2019-09-27
9010
【数据挖掘&机器学习篇】
随着互联网大数据行业的日渐兴盛,越来越多的人投身其中,也有很多的朋友对此有着浓厚的兴趣,想要投身其中。从本期开始我们将分四期带大家走进互联网大数据行业,分别了解数据挖掘&机器学习、数据分析、算法&深度学习、数据产品经理这四个不同的与大数据相关的职位。
数据森麟
2019-09-27
3870
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档