首页
学习
活动
专区
工具
TVP
发布

AI研习社

专栏作者
1755
文章
2079960
阅读量
197
订阅数
用 GPU 加速 TSNE:从几小时到几秒
原标题 | Accelerating TSNE with GPUs: From hours to seconds
AI研习社
2019-12-02
5.5K0
Scikit-learn 核心开发人员专访:建立机器学习工作流最容易犯这2点错误
本文是一篇对 Scikit-learn 开发者的专访,原载于 towardsdatascience,我们对其进行了编译整理,采访内容如下文。
AI研习社
2019-11-28
7530
利用 Spark 和 scikit-learn 将你的模型训练加快 100 倍
当我们使用 Spark 进行数据处理时,我们首选的机器学习框架是 scikit-learn。随着计算机变得越来越便宜,机器学习解决方案的上市时间变得越来越关键,我们探索了加快模型训练的各种方法。其中一个解决方案是将 Spark 和 scikit-learn 中的元素组合到我们自己的混合解决方案中。
AI研习社
2019-09-17
1.9K0
如何在 GPU 上加速数据科学
数据科学家需要算力。无论您是用 pandas 处理一个大数据集,还是用 Numpy 在一个大矩阵上运行一些计算,您都需要一台强大的机器,以便在合理的时间内完成这项工作。
AI研习社
2019-08-16
1.8K0
Python数据科学“冷门”库
Python是一门神奇的语言。事实上,它是世界上发展最快的编程语言之一。它已经一次又一次地证明了它在跨行业的开发人员职位和数据科学职位上的实用性。Python的整个生态系统及其库使其成为全世界用户(初学者和高级用户)的最佳选择。它的成功和流行的原因之一是它的健壮库集的存在,这些库使它能够做到非常动态和快速。
AI研习社
2019-07-30
1.1K0
合成数据生成——数据科学家必备技能
数据就像是新的石油,而事实上只有少数几个大玩家才有强大能力去这控制这种新的货币。谷歌和脸书非常慷慨地免费提供自家最新型的机器学习算法和软件包,因为现在进入算法世界的门槛已经是相当低了。自从被史蒂夫• 鲍尔默冠以恶名到成为微软公司不可或缺的部分,开源已经走过了一段漫长的路程。大量的开源项目正在推动数据科学、数字分析和机器学习的发展。
AI研习社
2019-05-08
1.1K0
使用 Scikit-learn 理解随机森林
在我以前的一篇文章(https://blog.datadive.net/interpreting-random-forests/)中,我讨论了随机森林如何变成一个「白箱子」,这样每次预测就能被分解为各项特征的贡献和,即预测=偏差+特征 1 贡献+ ... +特征 n 贡献。
AI研习社
2018-08-16
8830
Github 项目推荐 | 兼容 Scikit-Learn 的 PyTorch 神经网络库 —— skorch
Skorch 是一个兼容 Scikit-Learn 的 PyTorch 神经网络库。
AI研习社
2018-07-26
1.1K0
Github 项目推荐 | 用 Python 实现的大规模线性回归、分类和排名库 —— lightning
Lightning 稳定版本的预编译二进制文件在主要平台可用,需要用 pip 安装:
AI研习社
2018-07-26
7740
通过从零开始实现一个感知机模型,我学到了这些
编者按:本文源自作者 Jean-Nicholas Hould 的个人博客,他是一位来自加拿大蒙特利尔的数据科学家,具有丰富的研发和实践经验。本文节选自作者个人的学习笔记,原文见文末链接,AI研习社编译。 对许多刚入门机器学习的开发者而言,许多参数和定义都显得抽象、难以理解,可能许多人直到开始进入实际的项目研发,都还没能真正搞清楚这些参数和定义的确切含义。为此,我在这里故意避开 scikit-learn 等现成的算法工具,从零开始自己用 Python 实现了一个感知机二元分类器,一方面通过实际代码深入认识了感
AI研习社
2018-03-29
6390
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档