首页
学习
活动
专区
工具
TVP
发布

机器学习与统计学

专栏作者
792
文章
1089443
阅读量
96
订阅数
机器学习、深度学习思维导图
数据科学不是一蹴而就之事,而是一个需要设计,实施和维护的过程,下图包含对所涉及内容的快速概述。
统计学家
2019-12-05
4510
带你建立一个完整的机器学习项目
首先,我们需要预览这个项目。项目的目的是什么,以房价预测为例,数据为StatLib的加州房产数据,那么目的就是预测街区的房产价格中位数。
统计学家
2019-09-03
6290
安利!这是我见过最好的NumPy图解教程
NumPy是Python中用于数据分析、机器学习、科学计算的重要软件包。它极大地简化了向量和矩阵的操作及处理。python的不少数据处理软件包依赖于NumPy作为其基础架构的核心部分(例如scikit-learn、SciPy、pandas和tensorflow)。除了数据切片和数据切块的功能之外,掌握numpy也使得开发者在使用各数据处理库调试和处理复杂用例时更具优势。
统计学家
2019-08-09
1.6K0
整理一份详细的数据预处理方法
作者:lswbjtu https://zhuanlan.zhihu.com/p/51131210
统计学家
2019-07-15
4.4K0
【大数据名词3】MapReduce
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",和它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。
统计学家
2019-04-10
6340
【实验楼-Python 科学计算】Numpy - 多维数组(下)
矢量化是用 Python/Numpy 编写高效数值计算代码的关键,这意味着在程序中尽量选择使用矩阵或者向量进行运算,比如矩阵乘法等。
统计学家
2019-04-10
1.4K0
Python数据预处理概述
对于数据分析而言,数据是显而易见的核心。但是并不是所有的数据都是有用的,大多数数据参差不齐,层次概念不清淅,数量级不同,这会给后期的数据分析和数据挖掘带来很大的麻烦,所以有必要进行数据预处理。
统计学家
2019-04-10
9780
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档