首页
学习
活动
专区
工具
TVP
发布

Albert陈凯

专栏作者
530
文章
775813
阅读量
55
订阅数
2019-08-17 awesome-java,JAVA开发的武器库
A curated list of awesome Java frameworks, libraries and software.
Albert陈凯
2019-11-15
2K0
2019-07-26 rocketMQ 官方文档 最佳实践
https://github.com/apache/rocketmq/blob/master/docs/cn/best_practice.md
Albert陈凯
2019-07-28
1.7K0
2018-11-06 openhub.net开源项目。
借助openhub.net分析开源项目。 Name Homepage Metasploit Framework http://www.metasploit.com/framework/ NetBSD http://www.netbsd.org GNU C Library http://www.gnu.org/software/libc/ cURL http://curl.haxx.se/ Python programming language https://www.python.org Linux Ker
Albert陈凯
2018-12-07
1.6K0
2018-09-25 JAVA解析Excel工具easyexcel
JAVA解析Excel工具easyexcel Java解析、生成Excel比较有名的框架有Apache poi、jxl。但他们都存在一个严重的问题就是非常的耗内存,poi有一套SAX模式的API可以一定程度的解决一些内存溢出的问题,但POI还是有一些缺陷,比如07版Excel解压缩以及解压后存储都是在内存中完成的,内存消耗依然很大。easyexcel重写了poi对07版Excel的解析,能够原本一个3M的excel用POI sax依然需要100M左右内存降低到KB级别,并且再大的excel不会出现内存溢出,03版依赖POI的sax模式。在上层做了模型转换的封装,让使用者更加简单方便
Albert陈凯
2018-09-30
1K0
Hadoop数据分析平台实战——160Sqoop介绍离线数据分析平台实战——160Sqoop介绍
离线数据分析平台实战——160Sqoop介绍 Sqoop介绍 Apache Sqoop(SQL-to-Hadoop) 是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、oracle...)间进行数据的传递,可以将一个关系型数据库中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。 一般情况下,是将数据分析的结果导出到关系型数据库中,供其他部门使用。 Sqoop成立于2009年,刚开始是作为hadoop的一个模块而存在的,不过后来为了更好的进行
Albert陈凯
2018-04-08
1.2K0
一线公司hadoop实际案例及其应用
Hadoop的具体使用案例,我们选取了Yahoo!、百度、Facebook、eBay和海量数据排序为例进行说明,主要介绍了商业公司如何使用Hadoop来增强自己的服务,以及它们在使用Hadoop中遇到的各种问题和改进的方法。Hadoop是开源的系统,任何公司可以根据自己的业务需要对Hadoop进行修改或改进,同时也为Hadoop的改进贡献了自己的力量。 随着Hadoop的不断改进,其强大的分布式功能被越来越多的人熟知,使用Hadoop的公司队伍也在不断壮大中,具体可以登录http://wiki.apache
Albert陈凯
2018-04-08
1.3K0
Apache Spark常见的三大误解
最近几年关于Apache Spark框架的声音是越来越多,而且慢慢地成为大数据领域的主流系统。最近几年Apache Spark和Apache Hadoop的Google趋势可以证明这一点: 如果
Albert陈凯
2018-04-04
8450
Apache Spark快速入门
https://www.iteblog.com/archives/1408.html 一、 为什么要选择Apache Spark 当前,我们正处在一个“大数据"的时代,每时每刻,都有各种类型的数据被生产。而在此紫外,数据增幅的速度也在显著增加。从广义上看,这些数据包含交易数据、社交媒体内容(比如文本、图像和视频)以及传感器数据。那么,为什么要在这些内容上投入如此多精力,其原因无非就是从海量数据中提取洞见可以对生活和生产实践进行很好的指导。   在几年前,只有少部分公司拥有足够的技术力量和资金去储存和挖掘大
Albert陈凯
2018-04-04
1.3K0
Spark ReadmeApache Spark
Apache Spark Spark is a fast and general cluster computing system for Big Data. It provides high-level APIs in Scala, Java, Python, and R, and an optimized engine that supports general computation graphs for data analysis. It also supports a rich set of
Albert陈凯
2018-04-04
7460
Hadoop、Hbase、Hive版本兼容性
当我们想整合hadoop,hbase,hive,zookeeper的时候,如果刚入门,可能认为这是比较简单的问题。但是当你自己真正想整合的时候,却会遇到很多的问题。1.hadoop与hbase哪些版本兼容?2.hadoop与hive哪些版本兼容?3.hbase与hive哪些版本兼容?4.hbase与zookeeper哪些版本兼容?所以当我们真正想做整合的时候,我们需要解决上面四个问题,有些同学,忽略上面问题,直接部署,导致产生各种问题。所以我们现在就要解决上面问题。第一个问题,hadoop与hbase哪些版
Albert陈凯
2018-04-04
7.3K0
Apache Avro是什么干什么用的(RPC/序列化)
Avro总结(RPC/序列化) Avro(读音类似于[ævrə])是Hadoop的一个子项目, 由Hadoop的创始人Doug Cutting(也是Lucene,Nutch等项目的创始人,膜拜)牵头开发, Avro是一个数据序列化系统,设计用于支持大批量数据交换的应用。 它的主要特点有:支持二进制序列化方式,可以便捷,快速地处理大量数据;动态语言友好,Avro提供的机制使动态语言可以方便地处理Avro数据。 当前市场上有很多类似的序列化系统,如Google的Protocol Buffers, Faceboo
Albert陈凯
2018-04-04
2.9K0
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档