首页
学习
活动
专区
工具
TVP
发布

大数据智能实战

大数据与人工智能方向的论文复现、技术探索、工程实践的点滴记录和积累。
专栏作者
256
文章
389503
阅读量
56
订阅数
spark dataframe操作集锦(提取前几行,合并,入库等)
spark dataframe派生于RDD类,但是提供了非常强大的数据操作功能。当然主要对类SQL的支持。
sparkexpert
2022-05-07
1.3K0
spark dataframe新增列的处理
利用withColumn函数就能实现对dataframe中列的添加。但是由于withColumn这个函数中的第二个参数col必须为原有的某一列。所以默认先选择了个ID。
sparkexpert
2022-05-07
7540
Ubuntu环境下Redis的安装与JAVA连接测试
最近由于想测试一下内存数据库的性能,于是找了KV类中最普遍的Redis进行测试。首先需要安装一下,将安装过程在此记录一下。
sparkexpert
2022-05-07
2840
Ubuntu R中安装devtools的步骤
在尝试安装spark R的过程中,老是碰到错误,原因就是在安装devtools过程中经常出错,找了找网上的相关资料,才发现需要额外下载几个库,因此将这个过程记录下来。
sparkexpert
2022-05-07
8620
ubuntu环境下R统计环境的安装与igr…
参照网上的说法进行执行的。不过安装的时候还是出现了不少问题,其中有些地方 需要多加几下操作。
sparkexpert
2022-05-07
2690
HIVE备份之批量导出所有的HIVE建表字段
在HIVE实际工程部署当中,经常会用到一些备份,其中有一项就是如何保存所有HIVE表的建表命令语句。 当HIVE中表格特别多的情况下,如何批量进行存储呢。 针对这个问题,网上没有任何相关的资源。 不过从HIVE本身提供的语句是支持这个,只是需要批量处理。 最基本的两个语句:show tables; show create tables XXX. 于是建立一个SH文件,来实现批量化处理。如下: #!/bin/bash  hive -e "show tables;" > tables.txt sleep(2)
sparkexpert
2018-01-09
1.4K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档