Hive SQL:如何将一个字段拆分成多个定义长度的列？

sql、hive

例如: string = 'ABCDEFGHIJ‘ 现在，需要将字符串拆分为多个长度为4的列所需输出： Col1 Col2 Col3 'ABCD' 'EFGH' 'IJ'

浏览 68提问于2020-04-22得票数 0

2回答

配置单元“alter table <table name> concatenate”是如何工作的？

hadoop、hive、hiveql、orc

我有n(large)数量的小尺寸的orc文件，我想合并成k(small)数量的大的orc文件。任何指针都会很棒。

浏览 36提问于2017-01-24得票数 3

2回答

将SQL列转换为行

sql-server、rows

我想将一个记录列分成多个行。SELECT 1,2,31 | 2 | 313 我目前使用的是MS SQL 2008。

浏览 1提问于2012-05-09得票数 4

回答已采纳

3回答

如何解析System.Data.SqlClient.SqlException:字符串或二进制数据将被截断

con.Close();} “System.Data.SqlClient.SqlException”类型的异常发生在导致此异常的代码或存储过程中有什么问题，以及如何解决这个问题？

浏览 9提问于2016-09-06得票数 0

2回答

Oracle CLOB数据类型出现错误：` `SQL错误: ORA-01704:字符串文字太长`

oracle、insert、clob

All，我已经在Oracle中将一个列c1定义为CLOB。我正在尝试使用sql查询insert into t1 values(<large text>);插入一个大文本，这个查询给出的错误是SQL Error: ORA-01704: string literal当我将分成多个块并使用sql命令插入时：insert into values (to_clob(<chunk1>) || to_clo

浏览 9提问于2021-04-07得票数 0

1回答

创建包含许多列的表格

hive

从一个包含管道分隔符的大型文件中创建一个包含大量列(String)(>100)的Hive表的最佳方法是什么。如果我在create命令中提到100多个列名，会不会有问题。如果我决定不给每个列命名，我可以( a)根本不提列名，并让Hive按照其默认名称命名列名。我该怎么做？( b)只提到一些列，比如前10列。在这种情况下，剩下的列会发生什

浏览 2提问于2013-07-30得票数 1

1回答

如何在yii视图中将内容拆分成列-单独的divs

php、view、yii、pagination

我现在有一个很长的内容如何将超过某个定义长度的内容拆分成多个div？

浏览 1提问于2013-07-09得票数 0

1回答

蜂窝式介孔柱宽度极限

json、hadoop、hive、emr、metastore

使用5.2.1版本的AWS作为数据处理环境，当处理包含多个嵌套字段的复杂模式的大型文件时，Hive无法处理它，因为它达到了当前4000个字符列长度的限制。处理语句时出错:失败:执行错误，从org.apache.hadoop.hive.ql.exec.DDLTask返回代码1。InvalidObjectException(消息:无效列类型名称太长：. 看一下文档，关于这个问题或类似的问题已经有很

浏览 6提问于2017-02-01得票数 4

回答已采纳

2回答

Impala正在将时间转换为GMT如何避免这种情况

scala、hadoop、apache-spark、hive、impala

当我通过impala查询时，我将一个日期字段转换为hive中的时间戳为from_unixtime(unix_timestamp(), 'yyyy-MM-dd HH:mm:ss') as timestamp不仅我创建的列每个时间戳字段都要转换为GMT格式。请帮我处理sql查询或spark/scala代码，我试过用这个，它对我很有帮助。

浏览 10提问于2017-01-24得票数 3

5回答

几个蜂巢面试问题

hadoop、hive、hiveql、hadoop2、hadoop-streaming

我最近在一家公司的面试中遇到了一些问题。因为我是Hadoop的新手，有人能告诉我正确的答案吗？ Hive和SQL的主要区别是什么？请向我提供一些有用的资源，以便我能

浏览 7提问于2016-01-27得票数 2

1回答

Azure Sql数据仓库表记录的最大列数和大小是多少？

sql、sql-server、azure、data-warehouse

我希望在Azure Sql数据仓库中将多个表反规范化为一个表，这将需要大量的字段(~1500列)。有人知道PDW表的列数限制和最大行大小吗？另外，在性能和可维护性方面的最佳实践是什么？创建一个巨大的表或将其拆分成多个一对一的关系表。

浏览 4提问于2015-09-18得票数 1

3回答

Sqoop配置单元表导入，表dataType与数据库不匹配

hadoop、hive、hdfs、sqoop

使用Sqoop将数据从oracle导入到hive，它工作得很好，但它在hive中创建表只有2个dataTypes字符串和Double。我想使用timeStamp作为某些列的数据类型。我该怎么做呢。--table TEST_TABLE --connect jdbc:oracle:thin:@HOST:PORT:orcl --username USER1 -password password -hive-import--hive-home /user/lib/<

浏览 1提问于2014-01-24得票数 7

4回答

ODBC到CSV文件，需要使用Select语句中的分隔符拆分列

sql、csv、odbc

AAA-JOE A BLOGS-AAAA00001003-AAA-Lewis Hamilton-AAAA0000 我需要将这一列分成多个列，这很容易与固定长度的字段IE的前2节和最后3节，但在中间的可变长度字段被证明是困难的！因此，在上面的示例中，我希望获得一个名为NAME的</em

浏览 0提问于2017-03-21得票数 0

2回答

字符串或二进制数据将被截断。该语句已终止。上传配置文件时

c#、asp.net、image、visual-studio-2013、profile

我在配置文件属性中有一个图像。 <properties> <add name="MiddleName"/> } retu

浏览 2提问于2014-08-03得票数 5

1回答

根据两个表的条件更新外键

sql、postgresql、sql-update

假设我有一个自定义字段表，该自定义字段可以分组。我们还可以说我有一个组表。我们还假设，我有一个约定，即自定义字段名称的前缀应该是groupName_，其中groupName是groups表的标题列。如何更新大量现有的自定义字段以获取SQL中的组id？lower(title) AND fields.accoun

浏览 8提问于2014-11-12得票数 0

回答已采纳

1回答

为什么部件文件在单元输出中没有任何内容？

hadoop、amazon-ec2、hive

我的问题是我已经用hadoop在我的本地机器上尝试了这一点，并且使用AWS EC2来检查，在下面的查询中没有返回记录。下面的脚本是正确的，我知道这是事实吗？我的问题是为什么在工作完成后，我们在部件文件中没有看到任何结果。INT, hbp INT, sh INT, sf INT, gidp INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LOCATION 's3://hive-test1finalgame

浏览 2提问于2016-04-17得票数 0

回答已采纳

2回答

如何使用spark在蜂巢中正确加载数据？

scala、hadoop、apache-spark、hive、hiveql

我想输入的数据看上去-sqlContext.sql("

浏览 4提问于2017-06-28得票数 1

回答已采纳

1回答

HBASE与HIVE:有什么更适合于由多个字段唯一定义的数据？

hadoop、hive、hbase

我们正在Hadoop系统之上构建一个DB基础设施。我们将支付供应商这样做，我不认为我们是从第一个供应商得到正确的答案。所以，我需要一些专家的帮助来验证我是否是对的，或者我遗漏了1。我们在数据中有大约1600个字段。唯一的记录是由1600条记录识别的。有一些字段会更改加班(每月)。供应商表示，最好的方法是HBASE，他们

浏览 2提问于2018-12-01得票数 0

2回答

使用Ruby查找大型文件的最大CSV字段大小

ruby、csv

我正在尝试确定一个包含300多个字段的大型CSV文件(~5 5GB)的最大字段大小，我希望将这些字段转储到MySQL表中。我为文件提供的CSV文件模式给出了不正确的最大字段长度，因此我在表导入时遇到错误。我在Windows上运行Ruby2.0。我使用一个数组来根据字段的索引(或列)位置来存储最大字段长度

浏览 0提问于2013-07-23得票数 1

回答已采纳

1回答

1个平面文件，不同的架构取决于值

hadoop、avro

如果我有一个平面文件，并且列数随输入字段而变化，A,0,00,01，AlexA,2,22,02，Paul这里A有4个字段(id，number，rank，name)，B有2个字段(weight，height)，与C类似。现在，存储此数据的最佳方式是什么(Hive或Hbase)。因为我需要查询数据以进行分析。还能让我知道最好的方法吗？另外，可以根据第一个字段的输入创

浏览 4提问于2018-08-23得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

配置单元“alter table <table name> concatenate”是如何工作的？

将SQL列转换为行

如何解析System.Data.SqlClient.SqlException:字符串或二进制数据将被截断

Oracle CLOB数据类型出现错误：` `SQL错误: ORA-01704:字符串文字太长`

创建包含许多列的表格

如何在yii视图中将内容拆分成列-单独的divs

蜂窝式介孔柱宽度极限

Impala正在将时间转换为GMT如何避免这种情况

几个蜂巢面试问题

Azure Sql数据仓库表记录的最大列数和大小是多少？

Sqoop配置单元表导入，表dataType与数据库不匹配

ODBC到CSV文件，需要使用Select语句中的分隔符拆分列

字符串或二进制数据将被截断。该语句已终止。上传配置文件时

根据两个表的条件更新外键

为什么部件文件在单元输出中没有任何内容？

如何使用spark在蜂巢中正确加载数据？

HBASE与HIVE:有什么更适合于由多个字段唯一定义的数据？

使用Ruby查找大型文件的最大CSV字段大小

1个平面文件，不同的架构取决于值

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐