首页
学习
活动
专区
工具
TVP
发布

恩蓝脚本

脚本大全
专栏成员
12630
文章
26742044
阅读量
89
订阅数
python多维数组分位数的求取方式
在python中计算一个多维数组的任意百分比分位数,只需用np.percentile即可,十分方便
砸漏
2020-11-05
1.7K0
Pyspark获取并处理RDD数据代码实例
弹性分布式数据集(RDD)是一组不可变的JVM对象的分布集,可以用于执行高速运算,它是Apache Spark的核心。
砸漏
2020-11-04
1.4K0
python 实现 hive中类似 lateral view explode的功能示例
背景:加入现在有这样的数据,可能一条ocr代表两个label,并且label通过”,”分隔。我们想把数据转换成下面的。
砸漏
2020-11-02
1K0
在python中使用pyspark读写Hive数据操作
pyspark读取hive数据非常简单,因为它有专门的接口来读取,完全不需要像hbase那样,需要做很多配置,pyspark提供的操作hive的接口,使得程序可以直接使用SQL语句从hive里面查询需要的数据,代码如下:
砸漏
2020-10-29
11K0
python3.6.5基于kerberos认证的hive和hdfs连接调用方式
1. Kerberos是一种计算机网络授权协议,用来在非安全网络中,对个人通信以安全的手段进行身份认证。具体请查阅官网
砸漏
2020-10-29
4K0
python ETL工具 pyetl
pyetl是一个纯python开发的ETL框架, 相比sqoop, datax 之类的ETL工具,pyetl可以对每个字段添加udf函数,使得数据转换过程更加灵活,相比专业ETL工具pyetl更轻量,纯python代码操作,更加符合开发人员习惯
砸漏
2020-10-29
2.9K0
使用Python构造hive insert语句说明
mysql可以使用nevicat导出insert语句用于数据构造,但是hive无法直接导出insert语句。我们可以先打印在hive命令行,然后使用脚本拼装成insert语句,进行数据构造。
砸漏
2020-10-29
1.3K0
PHP 实现文件压缩解压操作的方法
在php中,有时我们需要使用到压缩文件操作,压缩文件可以节省磁盘空间;且压缩文件更小,便于网络传输,效率高,下面我们就来了解php的压缩解压相关操作
砸漏
2020-10-29
1.2K0
bt宝塔面板php7.3、php7.4不支持ZipArchive解决方法
宝塔面板php7.3版本不支持ZipArchive导致程序无法后台直接更新的解决方法
砸漏
2020-10-22
2.6K0
php利用ZipArchive类操作文件的实例
ZipArchive类是专门用于文件的压缩与解压操作的类,通过压缩文件可以达到节省磁盘空间的目的,并且压缩文件体积更小,便于网络传输。
砸漏
2020-10-20
2.3K0
Linux实现文件内容去重及求交并差集
日常工作中,使用Hive或者Impala查询导出来可能会存在数据重复的现象,但又不想重新执行一遍查询(查询时间稍长,导出文件内容多),因此想到了使用Linux命令将文件的内容重复数据进行去除。
砸漏
2020-10-10
1.2K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档