专栏首页北漂的我Hive 表的存储格式

Hive 表的存储格式

1. 建表, 存储格式为 ORC 格式

create table if not exists record_orc ( 
rid string, 
uid string, 
bid string, 
price int, 
source_province string, 
target_province string, 
site string, 
express_number string, 
express_company string, 
trancation_date date 
) 
stored as orc;

-- 查看建表信息
show create table record_orc; 


-- 另一种建表方式
create table record_parquet like record_orc stored as parquet;

2. 导入数据

insert into table record_orc select * from record; 

3. 查看 hdfs 文件所占空间的大小

hdfs dfs -ls /warehouse/mydb.db/record
hdfs dfs -ls /warehouse/mydb.db/record_parquet
hdfs dfs -ls /warehouse/mydb.db/record_orc

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • HBase 常用命令

    注意: 在 HBase Shell 中如果按退格键无法删除 , 则需要按 Ctrl + backspace 键

    北漂的我
  • [解决] Maven项目 update project 后项目的JDK版本变成默认的1.5 原

    在Eclipse中新建了一个Maven工程, 然后更改JDK版本为1.8, 结果每次使用Maven > Update project的时候JDK版本都恢复成默认...

    北漂的我
  • windows 环境下 安装 MariaDB 数据库

    2:解压zip安装包,将D:\mariadb-10.0.20-winx64\my-large.ini 复制到C:\Windows 并重命名成 my.ini,然后...

    北漂的我
  • ASP.NET WebAPI 测试文档 (Swagger)

    SwaggerUI是一个简单的Restful API测试和文档工具。简单、漂亮、易用(官方demo)。通过读取JSON配置显示API .项目本身仅仅也只依赖一些...

    HueiFeng
  • python生成随机密码串

       今天修改服务器密码,想来想去不知道设置什么密码比较好,索性设置随机数吧。python当中的random模块可以生成随机数,主要用这个生成随机密码。

    py3study
  • Multiple substitutions specified in non-positional format

    as3.0以上在gradle.properties使用android.enableAapt2=true,as就会提示将要过期了,请设置成 android.en...

    ppjun
  • Newtonsoft中Json和Xml的转换

    小狐狸
  • C#封装v5 COS API实践-put方法

    腾讯云技术服务团队
  • 蚂蚁区块链第16课 JS SDK数据模型(账户|合约|交易|收据|日志|区块)

    本文讲解蚂蚁区块链合约平台 JS SDK 涉及的数据模型,包括账户模型,合约模型,交易模型,收据模型,日志模型,区块模型。

    辉哥
  • C#WebApi同时上传数据和图片并通过SqlSugar存放到数据库

    最近项目中要做一些图片的存放功能,网上找了找WebApi的文件上传存放,用的挺多的是HttpPostedFileBase的方式,不过我希望是图片和数据都同时通过...

    Vaccae

扫码关注云+社区

领取腾讯云代金券