伦少的博客

61 篇文章
24 人订阅

全部文章

董可伦

ambari 异常总结及解决办法

1521
董可伦

spark-submit报错:Application application_1529650293575_0148 finished with failed status

2432
董可伦

Spark获取当前分区的partitionId

961
董可伦

Spark DataFrame按某列降序排序

1672
董可伦

Spark Streamming+Kafka提交offset实现有且仅有一次

6292
董可伦

通过offsets.retention.minutes设置kafka offset的过期时间

5983
董可伦

spark-submit提交Spark Streamming+Kafka程序

2915
董可伦

如何解决spark开发中遇到需要去掉文件前几行数据的问题

1983
董可伦

Spark架构原理

2955
董可伦

SparkStreaming+Kafka 实现基于缓存的实时wordcount程序

1836
董可伦

Spark读取压缩文件

1.7K10
董可伦

Scala日期操作

3073
董可伦

Spark 持久化(cache和persist的区别)

4364
董可伦

利用ogg实现oracle到kafka的增量数据实时同步

转载请务必注明原创地址为:https://dongkelun.com/2018/05/23/oggOracle2Kafka/

4.1K3
董可伦

Kafka安装启动入门教程

转载请务必注明原创地址为:https://dongkelun.com/2018/05/21/kafkaConf/

8133
董可伦

hive查询报错:java.io.IOException:org.apache.parquet.io.ParquetDecodingException

转载请务必注明原创地址为:https://dongkelun.com/2018/05/20/hiveQueryException/

43817
董可伦

spark ML之特征处理(1)

转载请务必注明原创地址为:https://dongkelun.com/2018/05/17/sparkMlFeatureProcessing1/

1K10
董可伦

Spark Streaming连接Kafka入门教程

转载请务必注明原创地址为:https://dongkelun.com/2018/05/17/sparkKafka/

53510
董可伦

旧版spark(1.6版本) 将rdd动态转为dataframe

转载请务必注明原创地址为:http://dongkelun.com/2018/05/11/rdd2df/

4225
董可伦

spark ML算法之线性回归使用

转载请务必注明原创地址为:http://dongkelun.com/2018/04/09/sparkMlLinearRegressionUsing/

5903

扫码关注云+社区

领取腾讯云代金券