伦少的博客

81 篇文章
25 人订阅

全部文章

董可伦

Java API 连接 Hbase示例

然后将hbase-site.xml,core-site.xml复制到本地(如果实在本地运行的话)

5120
董可伦

centos7 hbase1.4.13+hadoop2.7.1+单机环境搭建

因后续要学习研究hbase,那就先从搭建hbase开始吧。先搭建一个单机版的,方便自己学习使用。

6420
董可伦

Spark DataFrame isin方法使用

查询DataFrame某列在某些值里面的内容,等于SQL IN ,如 where year in(‘2017’,’2018’)

39610
董可伦

Spark 覆盖写Hive分区表,只覆盖部分对应分区

1、saveAsTable方法无效,会全表覆盖写,需要用insertInto,详情见代码 2、insertInto需要主要DataFrame列的顺序要和Hive...

67520
董可伦

Python 连接 MYSQL

11920
董可伦

Python 处理Excel总结(1)

pd.read_excel读出来是一个dataframe可以直接打印出内容,但是只能读取一个sheet页,默认第一个sheet页

19840
董可伦

windows 安装 pycharm 笔记

前两天为了升级pycharm,重新安装了一下,这里记录一下,之所以升级,是因为之前anaconda换成了64位的,也就是anaconda升级了,Python版本...

15020
董可伦

python anaconda 安装使用

地址:https://www.anaconda.com/distribution/#download-section

46220
董可伦

IDEA 新建Maven项目同时支持Java和Scala两种语言

之前用Eclipse+sbt+Scala,sbt 不支持Java,如果项目里包含Java文件打包会报错,现在有同时用Java和Scala的需求,比如写一个Jav...

42710
董可伦

SQL UNION 和 UNION ALL

总结SQL UNION的用法与UNION 和 UNION ALL的区别,并指出对应的场景以及可能出现的问题解决。

12820
董可伦

sbt 支持打包Java程序

最开始用sbt+scala,后来有了scala和Java混合使用的需求,之前在sbt项目下写Java程序,用idea和eclipse运行没问题,但是打包报错,所...

8510
董可伦

Oracle、Spark、Hive SQL 正则总结

Oralce和Hive、Spark除了函数不同外,正则也多少有不同,比如上例中Oraqlce只有一个 \ 而Hive和Spark有两个\,具体的正则匹配规则可参...

22610
董可伦

Nginx 安装配置

这时启动成功的话,就也可以在浏览器里输入 localhost (默认80端口)查看页面了

27330
董可伦

Sealed classes

Traits and classes can be marked sealed which means all subtypes must be declare...

7320
董可伦

Linux 定时任务命令crontab学习总结

学习总结一下Linux 定时任务命令crontab,实际工作中可能会碰到定时执行某个任务的需求,如每天凌晨(晚上12点后)对昨天的业务数据进行汇总,并将汇总结果...

9210
董可伦

Kafka学习笔记(1)

Kafka 的悄息通过主题进行分类。主题就好比数据库的表,或者文件系统里的文件夹。主题可以被分为若干个分区, 一个分区就是一个提交日志。消息以追加的方式写入分区...

7920
董可伦

Centos7 ELKB 7.2.0版本单机部署

本人新手,本文记录简单的ELKB单机部署,ELKB分别指elasticsearch、logstash、kibana、filebeat,用的当前官网最新版本7.2...

22310
董可伦

Oracle和MySQL如何判断是否为空或NULL

大概总结一下(有点懒): Oracle 最好用 IS NULL 和 IS NOT NULL MySQL 最好用 =’’ OR IS NULL 和 !=’’

15410
董可伦

Spark读取CSV异常 java.lang.ArrayIndexOutOfBoundsException:62

情况1: 将GBK编码的文件转文UTF-8(我碰见的),当然这种情况也可以用情况2中的解决办法解决~

23520
董可伦

将Vue项目部署到Github Page上

本文讲如何将Vue项目的dist文件夹部署到Github Page上,目的是可以在线访问前端效果,这样不需要自己购买服务器,当然任何静态文件夹都可以这样做,不止...

38910

扫码关注云+社区

领取腾讯云代金券