首页
学习
活动
专区
工具
TVP
发布

王小雷

专栏作者
167
文章
262499
阅读量
46
订阅数
Pipeline大数据架构
Pipeline大数据架构,面向大数据仓库和大数据处理平台。是基于lambda的大数据架构的变种,增加了企业级服务,而并非只是大数据组件的对切,是一种更落地的方案。 如同骨架之间使用软骨连接起来一样,是一个完整可执行的架构设计。形成Pipeline架构。
王小雷
2019-05-27
1.8K0
MapReduce的编程思想(1)
本文介绍了MapReduce的编程思想,包括分而治之、映射和化简等概念。同时,文章还介绍了MapReduce的计算框架、任务和资源的分配方式,以及MapReduce的局限性。
王小雷
2018-01-05
8480
基于Python3 神经网络的实现
摘要总结:本篇文章主要介绍了如何使用神经网络进行二分类问题,并针对不同的隐藏层大小进行了实验和分析。结果表明,较小的隐藏层大小可以更好地捕捉数据的趋势,但过小的隐藏层大小可能导致过拟合,而较大的隐藏层大小则可能导致欠拟合。因此,选择适当的隐藏层大小非常重要,需要根据具体问题进行分析和实验。
王小雷
2018-01-02
8360
Spark学习之数据读取与保存(4)
本文介绍了Spark在数据读取与保存方面的功能,包括对文本文件、JSON文件以及Spark SQL中结构化数据的读取和保存操作。同时,还介绍了如何使用Spark进行数据的转换和处理,以完成数据的读取和保存。
王小雷
2018-01-02
1K0
SAS进阶《深入分析SAS》之数据汇总和展现
本文介绍了SAS中数据汇总和表现两种方式:一种是列表,一种是图行。通过print和tabulate过程制作各种报表和汇总报表;GPLOT过程和GCHART过制作散点图、连线图、气泡图、柱状图等多种图行;ODS输出传送系统,包括如何选择或挑剔输出对象,创建多种格式的输出文件。
王小雷
2018-01-02
9940
Python之数据规整化:清理、转换、合并、重塑
Python之数据规整化:清理、转换、合并、重塑 1. 合并数据集 pandas.merge可根据一个或者多个不同DataFrame中的行连接起来。 pandas.concat可以沿着一条轴将多个对象
王小雷
2018-01-02
3K0
SAS进阶《深入解析SAS》之对多数据集的处理
本文介绍了SAS中数据集纵向串接和横向合并的方法,包括使用DATA步、SET语句、APPEND过程、MERGE语句等方法。同时,还介绍了如何通过数据集选项IN=操作观测和更新UPDATA语句对数据集进行更改。最后,介绍了数据集的更改和更新语句的注意事项和具体操作方法。
王小雷
2018-01-02
1.4K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档