首页
学习
活动
专区
工具
TVP
发布

Python数据科学

专栏作者
620
文章
876746
阅读量
105
订阅数
剑指LightGBM和XGboost!斯坦福发表NGBoost算法
Stanford ML Group 最近在他们的论文中发表了一个新算法,其实现被称为 NGBoost。该算法利用自然梯度将不确定性估计引入到梯度增强中。本文试图了解这个新算法,并与其他流行的 boosting 算法 LightGBM 和 XGboost 进行比较,以了解它在实践中是如何工作的。
Python数据科学
2019-11-27
8490
总结100个Pandas中序列的实用函数
经过一段时间的整理,本期将分享我认为比较常规的100个实用函数,这些函数大致可以分为六类,分别是统计汇总函数、数据清洗函数、数据筛选、绘图与元素级运算函数、时间序列函数和其他函数。
Python数据科学
2019-10-14
4640
10个Python常见面试题,这些弄不明白不要说学过Python!
Python是个非常受欢迎的编程语言,随着近些年机器学习、云计算等技术的发展,Python的职位需求越来越高。下面我收集了10个Python面试官经常问的问题,供大家参考学习。
Python数据科学
2018-12-21
3930
【机器学习笔记】:逻辑回归实战练习(二)
前几篇介绍了逻辑回归在机器学习中的重要性:5个原因告诉你:为什么在成为数据科学家之前,“逻辑回归”是第一个需要学习的
Python数据科学
2018-12-19
8470
深度学习参数怎么调优,这12个trick告诉你
1:优化器。机器学习训练的目的在于更新参数,优化目标函数,常见优化器有SGD,Adagrad,Adadelta,Adam,Adamax,Nadam。其中SGD和Adam优化器是最为常用的两种优化器,SGD根据每个batch的数据计算一次局部的估计,最小化代价函数。
Python数据科学
2018-12-19
2K0
20张图表达程序员的心酸
程序员最幽默(ID:humor1024)编译配字 「1」 被老板委派接手刚刚离职同事的项目... 「2」 当他们要求我测试所有应用功能时 「3」 准备下班的时候,测试又提bug过來了… 「4」 使用
Python数据科学
2018-12-19
3910
一款非常棒的特征选择工具:feature-selector
本篇主要介绍一个基础的特征选择工具feature-selector,feature-selector是由Feature Labs的一名数据科学家williamkoehrsen写的特征选择库。feature-selector主要对以下类型的特征进行选择:
Python数据科学
2018-12-19
2.1K0
想怎么GAN就怎么GAN,一键拯救发际线
生成对抗网络(GAN)除了生成各种各样的人脸,现在还能对人脸进行各种各样的精确“整容”。
Python数据科学
2018-12-17
4410
【机器学习笔记】:大话线性回归(三)
当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性,也就是说共线性的自变量提供了重复的信息。
Python数据科学
2018-12-13
1.5K0
这种 “交互可视化” 效果不要太赞了(配有动态展示)
本文介绍了如何在Jupyter Notebook中创建交互内容。所谓内容,主要指可视化内容。不过我们很快就会看到,这里的可视化内容不仅包括通常的图表,还包括有助于探索数据的交互界面和动画。
Python数据科学
2018-12-12
3.4K0
10行代码爬取全国所有A股/港股/新三板上市公司信息
摘要: 我们平常在浏览网页中会遇到一些表格型的数据信息,除了表格本身体现的内容以外,可能还想透过表格背后再挖掘些有意思或者有价值的信息。这时,可用python爬虫来实现。本文采用pandas库中的read_html方法来快速准确地抓取网页中的表格数据。
Python数据科学
2018-12-06
2.9K1
手把手 | 教你用几行Python和消费数据做客户细分
细分客户群是向客户提供个性化体验的关键。它可以提供关于客户行为、习惯与偏好的相关信息,帮助企业提供量身定制的营销活动从而改善客户体验。在业界人们往往把他吹嘘成提高收入的万能药,但实际上这个操作并不复杂,本文就将带你用简单的代码实现这一项目。
Python数据科学
2018-12-06
8000
5个原因告诉你:为什么在成为数据科学家之前,“逻辑回归”是第一个需要学习的
来源 | https://towardsdatascience.com/5-reasons-logistic-regression-should-be-the-first-thing-you-learn-when-become-a-data-scientist-fcaae46605c4
Python数据科学
2018-10-18
4940
腾讯:首个在一场完整星际Ⅱ比赛中击败作弊级Bot的AI
编者按:19日,来自腾讯AI Lab、罗切斯特大学和西北大学的研究人员发表了一个预印本《TStarBots: Defeating the Cheating Level Builtin AI in StarCraft II in the Full Game》,文章介绍了两个AI:TStarBots1和TStarBots2,它们首次在完整的虫族VS虫族比赛中击败了星际争霸Ⅱ的内置AI Bot,是研究史上的又一大壮举。虽然不是严格意义上的“自学”,AI还高度依赖人为归纳的信息,但迄今为止,这是我们在星际Ⅱ项目上见到的最有建树的成果,值得期待。
Python数据科学
2018-10-18
5700
P2P网贷信用评分项目分享(一)
此项目为kaggle竞赛平台的give me some credits。其目的是预测银行用户违约概率,以辅助银行判断是否要对用户进行放贷。关于风险控制建模的大致流程可参考以下链接:
Python数据科学
2018-10-18
1.2K0
【机器学习笔记】:一文让你彻底记住什么是ROC/AUC(看不懂你来找我)
ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到)。其实,理解它并不是非常难,但是好多朋友都遇到了一个相同的问题,那就是:每次看书的时候都很明白,但回过头就忘了,经常容易将概念弄混。还有的朋友面试之前背下来了,但是一紧张大脑一片空白全忘了,导致回答的很差。
Python数据科学
2018-10-18
2.4K0
教师节来了,我用Python送她一个小猪佩琪
作为一个女朋友是教师的我,教师节来了,却不知送她什么。辗转反侧,突然脑海里有了一个想法:送给她一个小猪佩琪(因为她喜欢),而且要用Python来画。虽然这个小猪佩琪只是锦上添花而已(一个小猪佩琪怎么可能满足女朋友的要求!而且还是Python做的!当然还有别的东西了!),但是还是可以说明我用了心的。
Python数据科学
2018-09-14
1.6K0
99%的人都不知道的pandas骚操作(一)
pandas有一种功能非常强大的方法,它就是accessor,可以将它理解为一种属性接口,通过它可以获得额外的方法。其实这样说还是很笼统,下面我们通过代码和实例来理解一下。
Python数据科学
2018-09-14
1.2K0
关于互联网金融授信产品的风控建模
随着互联网渗透到生活中的各个角落,金融行业也似乎找到了与互联网的完美结合。互联网金融作为一个新的行业如今正在上升的势头上,因而也涌现了越来越多的P2P公司。但是作为一个互金公司来讲,风险永远是一个最重要的话题。那么如何利用机器学习以及大数据技术来降低风险呢?如何建立信用评分的模型呢?
Python数据科学
2018-09-14
3K0
如何用Python过一个完美的七夕节?
一年一度的七夕节又到了,每年重复的过,花样各种有,很多男同胞又开始发愁了,该准备点什么呢?前一段时间非常火的电影 “西红市首富” 突然给了我点灵感,男主全城放烟花俘获了女主的芳心。没错!就是放烟花,而且要全城放。
Python数据科学
2018-09-14
2.9K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档