首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2139
文章
1934333
阅读量
188
订阅数
【Manning新书】自然语言处理入门
来源:专知本文为书籍介绍,建议阅读5分钟这本书可以通过一系列的实际应用作为一个全面的指南。 我写这本书的主要目的是帮助你了解NLP领域是多么令人兴奋,在这个领域工作的可能性是多么无限,以及现在的门槛是多么低。我的目标是帮助你轻松开始在这个领域,并向你展示你可以在几天内实现多么广泛的不同的应用,即使你以前从未在这个领域工作过。这本书可以通过一系列的实际应用作为一个全面的指南,如果你只对一些实际任务感兴趣,也可以作为参考书。到你读完这本书的时候,你就已经学会了: https://www.manning.com
数据派THU
2022-09-27
3130
独家 | 时间信息编码为机器学习模型特征的三种方法(附链接)
作者:Eryk Lewinson 翻译:张睿毅校对:张睿毅 本文约4200字,建议阅读10分钟本文我们主要使用非常知名的Python包,以及依赖于一个相对不为人知的scikit-lego包。 标签:数据帧, 精选, 机器学习, Python, 技术演练 设置和数据 在本文中,我们主要使用非常知名的Python包,以及依赖于一个相对不为人知的scikit-lego包,这是一个包含许多有用功能的库,这些功能正在扩展scikit-learn的功能。我们导入所需的库,如下所示: import n
数据派THU
2022-04-25
1.5K0
高斯朴素贝叶斯分类的原理解释和手写代码实现
来源:DeepHub IMBA本文约3500字,建议阅读10+分钟本文与你介绍高斯分布的基本概念及代码实现。 Gaussian Naive Bayes (GNB) 是一种基于概率方法和高斯分布的机器学习的分类技术。朴素贝叶斯假设每个参数(也称为特征或预测变量)具有预测输出变量的独立能力。所有参数的预测组合是最终预测,它返回因变量被分类到每个组中的概率,最后的分类被分配给概率较高的分组(类)。 什么是高斯分布? 高斯分布也称为正态分布,是描述自然界中连续随机变量的统计分布的统计模型。正态分布由其钟形曲线定
数据派THU
2022-04-25
1.2K0
独家 | 将时间信息编码用于机器学习模型的三种编码时间信息作为特征的三种方法
作者:Eryk Lewinson 翻译:汪桉旭校对:zrx 本文约4400字,建议阅读5分钟本文研究了三种使用日期相关的信息如何创造有意义特征的方法。 标签:时间帧,机器学习,Python,技术演示 想象一下,你刚开始一个新的数据科学项目。目标是建立一个预测目标变量Y的模型。你已经收到了来自利益相关者/数据工程师的一些数据,进行了彻底的EDA并且选择了一些你认为和手头上问题有关的变量。然后你终于建立了你的第一个模型。得分是可以接受的,但是你相信你可以做得更好。你应该怎么做呢? 这里你可以通过许多方式跟进。
数据派THU
2022-03-24
1.5K0
独家 | 拓扑机器学习的神圣三件套:Gudhi,Scikit-Learn和Tensorflow(附链接&代码)
本文简要介绍了机器学习中拓扑数据分析的力量并展示如何配合三个Python库:Gudhi,Scikit-Learn和Tensorflow进行实践。
数据派THU
2020-03-26
9280
独家 | 使用Python了解分类决策树(附代码)
本教程介绍了用于分类的决策树,即分类树,包括分类树的结构,分类树如何进行预测,使用scikit-learn构造分类树,以及超参数的调整。
数据派THU
2019-10-10
2.5K0
独家 | 菜鸟级机器学习入门(附代码实例)
本文中,数据科学创业公司Yhat的前联合创始人,现任Waldo的联合创始人兼首席技术官Greg Lamp将会为我们这些机器学习菜鸟分享他对机器学习的看法。
数据派THU
2019-07-08
6010
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档