基于SQL / Hive中的条件比较同一列中的日期_基于同一列中的条件的sql列_基于日期比较sql的列的缺失值 - 腾讯云开发者社区

apache-spark、hive、apache-spark-sql、hiveql、dremio

我有hive外部表(以拼图格式存储的s3文件)，用spark创建，大小约为30 GB，具有数百个分区。但是，我需要查询非分区列(比如SUPPLIER_ID)上的数据，以查看完整的事务历史记录，而不是特定于某个期间或日期(分区列)。在不确定Hive表上的哪个分区数据属于哪个分区的情况下，如何确保这种查询模式？

浏览 3提问于2021-06-09得票数 0

3回答

比较配置单元中两个分区的数据

hive、hql、md5

我在hive中的每个分区中都有900万条记录，并且我有两个分区。该表有20列。现在，我想基于id列比较分区之间的数据集。考虑到有900万条记录的self join会产生性能问题，这是最好的方法。

浏览 2提问于2014-08-29得票数 0

2回答

配置单元:连接两个表时，检查表1中的字符串是否出现在表2中的字符串列表中

sql、string、list、join、hive

我正在尝试连接一个字符串(表1中的列)是否出现在Hive QL中的字符串列表(表2中的列)中。有人能帮我学一下语法吗？ SELECT A.id FROM tab1 A inner join tab2 B ON ( (array_contains(B.purchase_items, A.item_id) = true ) ) 上述SQL不起作用。

浏览 2提问于2013-11-02得票数 0

1回答

从Hive表(avro格式)日期(或字符串)列到SQL Server日期列的Sqoop？

sql-server、hadoop、sqoop

我正在尝试从具有日期(或字符串)列的Hive表(avro格式)到具有日期列的SQL Server表。但是我得到了：错误: java.lang.ClassCastException:无法将java.lang.Integer转换为java.sql.Date 有人知道怎么解决这个问题吗？ PS:我尝试添加--map- column_name=date -hive列--没有帮助

浏览 2提问于2016-01-22得票数 0

1回答

函数可以获得历元毫秒或将时间转换为毫秒，而不需要将毫秒转换为秒。

sql、hive、snowflake-cloud-data-platform

是否有一种方法可以在时代毫秒内获得日期，或者在蜂巢中得到日期呢？有些函数像"unix_timestamp()“和"from_unixtime()”，但是它们只工作秒。 P.S :我的用例限制我将秒转换为毫秒(秒*1000 =millis) 背景->，我想写一个查询，它应该在hive和雪花中运行，而不改变语法，但是HIVE中列的数据类型是BIGINT，而雪花中的数据类型是时间戳。unix_timestamp('20220714'，'yyyyMMdd')*1000 > SomeColumn 我在雪花中为unix_timestamp创建了函

浏览 8提问于2022-07-14得票数 0

2回答

从今天起减去7天

sql、hive

我是hive和sql的新手。有没有办法在Hive中获取当前日期-7，即7天前的日期。我的表中的日期格式为20150910。(yyyyMMdd)。我尝试了下面的查询，但它没有返回任何东西。 select * from gmr.tedf_cs_mrch_tran where cpd_dt = FROM_UNIXTIME( UNIX_TIMESTAMP( DATE_SUB( FROM_UNIXTIME(UNIX_TIMESTAMP(),'yyyy-MM-dd') , 7

浏览 0提问于2015-09-10得票数 0

1回答

配置单元sql中的日期时间比较

hive、timestamp、hiveql

在配置单元sql中，我有以下字段作为日期和时间 date_time 2017-01-01 12:00:00 min_date 2017-02-01 12:00:00 我可以将这两个字段作为date_time > min_date进行比较吗在我的sql查询中？如何比较hive sql中的日期时间？两种时间戳类型

浏览 0提问于2018-02-05得票数 2

1回答

如何根据另一个单元格的日期是否已过而将格式应用于另一个单元格？

google-sheets、conditional-formatting

我正在做谷歌表格中的电子表格，我试图有一个列的名字，然后一列的日期毗邻它。我想设置某种条件格式，以检查单元格的日期是否已经过去，如果已经过了，则在name列中使用删除设置相应的单元格格式。 Names | Dates | Etc. Name Here | Date | --- Name 2 | Date2 | --- 因此，如果“日期”下列出的第二个日期已经通过(与今天的日期1/19/16相比，又名1/10/16，而不是2/19/16 )，那么在“名称”下列出的第二个名称就会出现带有删除格式的格式(就像您将其划掉一样)。

浏览 0提问于2016-01-19得票数 2

2回答

如何使用Hive SQL将2017年7月1日转换为dd-MM-yyyy？

hive、hiveql、date-formatting

我有一个Hive表，它有一个Week列，值如下：我必须使用hive SQL将此字段转换为日期格式，如: 2017-07-01 (yyyy-MM-dd)。有什么建议吗？

浏览 13提问于2018-08-29得票数 1

回答已采纳

1回答

Sqoop :导入所有转换blob类型的表

oracle、sqoop

我正在尝试从Oracle11gCLOB(导入所有表)中导入所有表，但我遇到了R2类型的问题。(使用CDH 5.9，Sqoop 1.4.6-cdh5.9.1) 第一次尝试： sqoop import-all-tables --connect ... --hive-import --hive-overwrite --as-parquet-file --autoreset-to-one-mapper -m XX --direct 在找到一个具有CLOB列的表之前，将正确导入表，并抛出以下错误:无法转换为SQL类型2005。第二次尝试： sqoop import-all-tables -D orao

浏览 28提问于2017-02-06得票数 2

2回答

Spark中的重新分区

apache-spark、apache-spark-sql

我们使用Spark的SQL 对集群上的Hive表执行查询。如何对查询中的列执行REPARTITION ( SQL-API )？请注意，我们不使用Dataframe，而是使用SQL (例如，SELECT * from table WHERE col = 1)。我理解PySpark在Dataframe API中提供了一个相同的函数。但是，我想知道通过REPARTITION SQL -API(通过SELECT语句)在SQL查询中指定(在特定列上)的语法。考虑以下查询： select a.x, b.y from a JOIN b on a.id = b.id 任何帮助都是非常感谢的。我们使用星

浏览 1提问于2020-06-23得票数 1

回答已采纳

1回答

用于以不同格式获取特定日期数据的mysql查询

php、mysql、date

我有一个名为event的表，其中包含五列: event_id、Date、timing、event_type_id和capacity。我正在尝试从表event中获取记录，其中日期列与格式为mm/dd/yyyy的特定日期相匹配下面是我的php代码： <?php $con=mysqli_connect("localhost","root","simple","eventsdb"); // Check connection if (mysqli_connect_errno()) { echo "Failed to c

浏览 0提问于2017-07-22得票数 0

1回答

Server能否自行执行基于哈希的行相等(用于合并操作)？

sql-server

我正在开发的系统使用Server将查询结果存储在表中。行组表示特定日期(DataDate)的数据快照，随着新数据的替换，该数据将最终过期。该表保留旧数据，而不是覆盖它。下面是一个简单的例子： CREATE TABLE query1234Results ( -- Metadata columns: AccountId int NOT NULL, DataDate date NOT NULL, Appeared datetime NOT NULL, Disappeared datetime NULL, Upd

浏览 0提问于2018-10-14得票数 1

2回答

查询spark 2.2.0中的配置单元表

apache-spark、hadoop、hive、apache-spark-sql

我有一个avro文件格式的hive表(比如table1)，其中有1900列。当我在hive中查询表时-我能够获取数据，但是当我在spark sql中查询同一个表时，我得到了metastore客户端丢失的连接。正在尝试重新连接我还查询了另一个avro文件格式的hive表(比如table2)，它有130列，正在获取hive和spark中的数据。我观察到的是，我可以在table2的hdfs位置看到数据，但在table1 hdfs位置看不到任何数据(但当我仅在hive中查询时，它正在搜索数据)。

浏览 3提问于2019-06-29得票数 2

1回答

如何在Oracle DB中将日期/时间戳字符串写入日期时间戳列？

oracle、hadoop、apache-spark、hive、avro

我用Hadoop存储了一些Oracle表，使用AVRO文件格式和Hive外部表来访问数据。我在导入时使用来自Oracle的TO_CHAR函数将日期和时间戳值存储为格式化字符串。现在，我想将这些精确的数据导出回一个带有日期列的Oracle表中。我使用以下命令： // Create a data frame from the Hive table val data = sqlContext.sql("select * from avro_table") // export df to existing oracle table data.write.mode("ove

浏览 3提问于2017-12-09得票数 1

回答已采纳

2回答

比较两列中的日期

excel-formula

我需要比较电子表格中两列中的日期，看看其中一个日期是否比另一个日期晚2天。例如，列H2中的日期是否等于列A2中的日期+2天？这种比较的公式是什么？

浏览 0提问于2014-03-07得票数 2

1回答

以定义的格式提取时间戳和日期。

hive

我的HIVE表中有一个字符串格式的列值，如20160921091213，即YYYYMMDDHHMMDD。在目标中，我有两个列，一个是时间戳，另一个是日期列。我想提取相同格式的时间戳"YYYY-MM-DD MI 24:MI:SS“和日期格式"YYYY-MM-DD”。什么是可能的SQL对此。

浏览 2提问于2016-09-23得票数 0

回答已采纳

1回答

加载蜂巢表中的火花org.apache.spark.sql.catalyst.analysis.UnresolvedException错误

apache-spark、apache-spark-sql

在尝试将数据集中的数据加载到Hive表时，获取错误： org.apache.spark.sql.catalyst.analysis.UnresolvedException:对未解析对象树dataType的无效调用：'ipl_appl_signed_date 我的dataset包含与Hive表相同的列，其获取错误的列在我的代码(Java)中以及在Hive中都有日期数据类型。 java代码： Date IPL_APPL_SIGNED_DATE =rs.getDate("DTL.IPL_APPL_SIGNED_DATE"); //using jdbc to get

浏览 0提问于2018-09-03得票数 1

2回答

如何升级Azure数据库中的Hive版本

azure、apache-spark、hadoop、hive、azure-databricks

org.apache.hadoop.hive.ql.metadata.HiveException： java.lang.UnsupportedOperationException：不支持时间戳。见蜂箱-6384；在中执行下面的代码时出现以上错误。 spark_session.sql(""" CREATE EXTERNAL TABLE IF NOT EXISTS dev_db.processing_table ( campaign STRING, status STRING, file_name STRING,

浏览 4提问于2020-09-13得票数 1

2回答

如何在Hive中格式化yyyy-MMMM？

sql、hadoop、hive

我尝试将日期列("craeteddate")格式化为yyyy-mmmm，即:2017-11月份。 select unix_timestamp(createddate, 'yyyy-MMMM') from cc_vw_case 此SQL抛出“错误的日期/时间转换格式: yyyy-MMMM”。在Hive中可能的格式是yyyy-MMMM吗？我使用的是Cloudera Hadoop。

浏览 2提问于2017-11-09得票数 0

1回答

在星火中未继承的视图上的蜂巢权限

apache-spark、hive、apache-spark-sql

我在蜂巢里创建了拼花桌test_table。其中一个分区的位置是'/user/hive/warehouse/prod.db/test_table/date_id=20210701'。根据此表创建视图： create view prod.test_table_vw as select date_id, src, telephone_number, action_date, duration from prod.test_table 然后将select特权授予某些角色： GRANT SELECT ON TABLE prod.test_table_vw TO ROLE data_a

浏览 4提问于2021-08-03得票数 0

回答已采纳

1回答

用于选择除某些列之外的所有列的配置单元UDF

apache-spark、hive、hiveql、apache-spark-sql、udf

HiveQL (以及一般的SQL语言)中常见的查询构建模式是选择所有列(SELECT *)或显式指定的一组列(SELECT A, B, C)。SQL没有内置的机制来选择除指定的一组列之外的所有列。有多种机制可以排除中列出的某些列，但没有一种机制自然地适用于HiveQL。(例如，使用SELECT *创建临时表，然后使用ALTER TABLE DROP创建临时表的一些列的想法将在大数据环境中造成严重破坏。) 忽略了关于选择除部分列之外的所有列是否是一个好主意的意识形态讨论，这个问题是关于使用此功能扩展Hive的可能方法。在配置单元0.13.0之前，SELECT可以采用基于正则表达式的列，例如，

浏览 2提问于2015-07-28得票数 11

6回答

为每个ID多次重复选择带有最新日期的sql行

mysql、sql、hive

我有一张桌子，每个ID重复三次。在每一行的每个id前面都有一个日期。我想为每一个日期是最近的ID选择整行。该表中共有370列，我希望在选择该行时选择所有列。样本- ID Name Date Marks .. .. .. 1 XY 4/3/2017 27 1 fv 4/3/2014 98 1 jk 4/3/2016 09 2 RF 4/12/2015 87 2 kk 4/3/2009 56 2 PP 4/3/2011

浏览 0提问于2017-07-28得票数 30

回答已采纳

1回答

从Oracle加载表到Hive，日期和时间戳转换为string

sqoop2、sqoop

我在Sqoop手册中注意到了这一点： 24.5。蜂巢中的模式定义用户将注意到SQL类型和Hive类型之间没有一对一的映射。通常，没有直接映射(例如日期、时间和时间戳)的SQL类型将被强制使用Hive中的字符串。数字和十进制SQL类型将被迫加倍。在这种情况下，Sqoop将在其日志消息中发出警告，通知您丢失了精确度。我知道Sqoop可以使用 --map-column-java --map-column-hive 但我的情况是，我需要一个通用类型到一个类型的映射，从RDBMS类型到HIVE类型映射，这需要将日期或日期时间转换为日期或时间戳。有解决办法吗？

浏览 2提问于2016-05-06得票数 1

1回答

CDH5.4.2火花可以在火花壳中使用HiveContent，但不能打开火花-sql

apache-spark、cloudera-cdh、hivecontext

我使用的是CDH5.4.2的火花(独立的) 在将hive-site.xml复制到$SPARK_HOME/conf之后，我可以从spark-shell中的hive查询，如下所示： org.apache.spark.sql.hive.HiveContext@6c6f3a15 scala> hiveContext =新的org.apache.spark.sql.hive.HiveContext(sc)；hiveContext: org.apache.spark.sql.hive.HiveContext = scala> hiveContext.sql(“显示表”).show()；

浏览 8提问于2016-07-26得票数 0

1回答

获取变量中的数据列，如何？

scala、apache-spark、dataframe、hive、apache-spark-sql

环境: Spark 1.6，Scala 我正试图从dataframe中获取一个日期时间字段，以便在SparkSQL中进行比较。 val las_max_date_from_hive= hivecontext.sql("select min(SampleTime) max_SampleTime from mytable") DF2 = hivecontext.sql ("select * from table2 where sampleDate >" + las_max_date_from_hive) // error here as las_max_d

浏览 0提问于2016-12-29得票数 0

回答已采纳

1回答

如何在HiveQL中获取‘事件日期>当前日期- 10天)？

sql、hadoop、hive、hiveql、impala

我正在整理一个每天都会刷新的查询，它需要从过去的十个日期中提取记录。我正在访问的表有一个带有unix时间戳的'xxdatetime‘列和一个带有yyyy-mm-dd格式的日期的'eventdate’列。在Impala，答案很简单： where eventdate > to_date(days_sub(now(), 10)) 我在Hive中使用了它的一个变体，但失败了，因为我猜它正在扫描整个表，而表是巨大的： where datediff(cast(current_timestamp() as string), eventdate)=10 在Hive SQL中有没有一种

浏览 0提问于2015-10-25得票数 0

1回答

比较sql中三列的最佳方法

sql、hive

我需要通过在Hive中包含字符串日期‘yyyy’的3列进行一些比较。请考虑到该表有200多万份记录。考虑表col1中的三列( col2；col3)，我必须保证： col1 = col2，或者至少有一个与col3.不同我向你问好，

浏览 2提问于2022-03-08得票数 -1

回答已采纳

1回答

数据参数在配置单元中未按预期工作

hive

我正在向hive脚本传递数据参数，但它不起作用。 SET yrmonth=concat(substr(to_date(${hiveconf:runningdate}),1,4),substr(to_date(${hiveconf:runningdate}),6,2)); SET fom=TRUNC(${hiveconf:runningdate},'MONTH'); SET lom=LAST_DAY(${hiveconf:runningdate}); USE cust_db; SELECT saleid,podid,pname FROM product WH

浏览 2提问于2016-08-13得票数 1

1回答

将SQL查询转换为Hive查询

sql、database、hadoop、hive

我在将SQL查询转换为Hive查询时遇到了一些问题。关系模式： Suppliers(sid, sname, address) Parts(pid, pname, color) Catalog(sid, pid, cost) 查询1:查找有供应商的零件的名称。我尝试过查询1的查询转换之一，如果有人能告诉我它是正确的还是不正确的，我认为这是正确的，我真的很感激。根据我查到的蜂巢信息，它们对我来说似乎是一样的。查询1: SQL SELECT pname FROM Parts, Catalog WHERE Parts.pid = Catalog.pid 查询1:转换为Hive SELECT pna

浏览 2提问于2015-03-07得票数 1

2回答

Spark(2.3)无法识别通过Hive Alter命令添加的Parquet表中的新列

hadoop、hive、pyspark、parquet、apache-spark-2.3

我有一个Hive表，我正在使用Spark2.3API df.saveAstable创建它。有一个单独的Hive过程，它修改相同的拼花表以添加列(基于需求)。但是，下一次当我尝试将相同的parquet表读入Spark时，使用However命令添加到parquet表中的新列将不会显示在df.printSchema输出中。根据初步分析，似乎有一些冲突，星火正在使用自己的模式，而不是阅读蜂巢亚稳态。因此，我尝试了以下几种选择：更改星火设置：spark.sql.hive.convertMetastoreParquet=false并刷新星火目录：spark.catalog.refreshTable(&

浏览 1提问于2019-06-28得票数 4

1回答

对Hive表执行验证和检查(可能不是重复的)

sql、hive、hiveql

我们知道Hive不根据字段验证数据，手动检查数据是用户的责任。我知道很少有基本的检查，我们可以执行，以验证数据。数一下记录的数量。每栏的空数每列上唯一/不同值的数目基于列/数据类型的列级别统计(如min、max等) 使用Hive的内置函数to_date和其他函数检查日期列的验证我确信，为了验证Hive表上的数据，我们必须执行很少的检查或验证。欢迎您提出任何建议。

浏览 0提问于2019-05-22得票数 5

回答已采纳

1回答

无法查看通过Spark SQL创建的新数据

java、apache-spark、hive、apache-spark-sql

我正面临一个问题，在这个问题中，我无法查看来自Hive的某些数据。重现问题的步骤。创建一个表 drop table if exists hive_parquet_nulls_test ; create table hive_parquet_nulls_test ( name String ) partitioned by (report_date DATE) stored as PARQUET; 然后创建一个具有新列的数据框并加载它们 import java.sql.Date import org.apache.spark.sql._ import org.apache.spark.s

浏览 30提问于2019-12-21得票数 3

回答已采纳

1回答

Microsoft Access 2010:查询条件移动

ms-access、ms-access-2010

在我的数据库中，我在设计视图中进入了一个查询页面，并在单独的列中输入了以下两个标题： MonthsSince: DateDiff("m",[LastContact],Now()) LastContactError: DateDiff("m",[LastContact],Now()) 我想设置的标准是：">6“和"<0” >6条件过滤结果，以便用户知道自从联系相关人员以来已经有六个月了The <0条件显示错误的日期，特别是如果用户将LastContact日期设置为将来的话我遇到的问题是，Microsoft acces

浏览 5提问于2016-06-20得票数 0

3回答

配置单元时间戳查询

sql、hadoop、casting、hive、timestamp

我创建了一个具有时间戳列(数据类型为timestamp)的hive表，格式如下： 2017-01-23 21:23:17.261456 然而，当我这样选择的时候。它不能正常工作。它将选择时间戳之后的日期。列应该是一个字符串还是我使用的查询是错误的？ select * from example where time_created < '2017-01-01 22:30:57.375117'

浏览 1提问于2017-02-14得票数 3

1回答

更新ssis工作流中的日期

date、ssis

首先，我刚开始使用SSIS，我需要帮助解决这个问题。我得到了下一个工作流程，直到我得到一个与源中的日期相关的错误，一切都很正常。错误是:某些日期的年份类似于0001 (oracle源)，但sql server不接受这一点(我不能更改数据库中为该字段建立的类型)。我有下一个工作流程，其中我重定向了这个错误(图1)：现在，我需要这样做：如果日期< '1900-01-01‘，则日期= '1900-01-01’ 所以，我想到了一个解决方案，就像在图像2中一样，使用了一个派生列。但我不知道如何在SSIS中表示if条件，如果这是处理此问题的最佳方法，则更好。问候

浏览 4提问于2015-01-21得票数 0

回答已采纳

2回答

如何在Hive SQL中执行日期列的中间操作符

sql、hadoop、hive、cloudera、bigdata

我会尽量解释清楚我的问题。我想按日期筛选一个表(只选择包含在当前月份中的日期的记录)，在Oracle中，我使用以下查询来实现这个目标： select * from table t1 where t1.DATE_COLUMN between TRUNC(SYSDATE, 'mm') and SYSDATE 如何在Hive SQL中复制相同的过滤器？用于应用过滤器的列是时间戳类型列(例如，2017-05-15 00:00:00)。我用的是CDH 5.76-1。有什么建议吗？

浏览 1提问于2017-05-15得票数 0

回答已采纳

4回答

比较SQL Server T-SQL中的日期/时间

sql、sql-server、tsql

对于表中的每一行，我们将此格式的日期/时间存储在varChar列中: 2013-05-26 20:22:07.2894。如何在T_SQL WHERE语句中使用该列来检索过去1小时内的行？我们已经尝试过了，它是有效的: WHERE SQL> '2013-05-26 18:00:00:0000‘然而，我们希望T- Time_Stamp自动工作，而不是硬编码日期/关系。

浏览 7提问于2013-05-27得票数 3

回答已采纳

2回答

Server是否优化了同一列上的两个">“操作？

sql-server、sql-server-2012、optimization

SQL Server可以优化以下内容： DECLARE @id INT; DECLARE @d1 DATE; SELECT a, b FROM t WHERE id_column = @id AND date_column >= CAST(CURRENT_TIMESTAMP AS DATE) AND date_column >= @d1 注意，同一列上有两个>运算符。假设今天是2020-12-23和d1，可能是2020-12-20或2020-12-27，我希望Server自动使用这两个日期中更大的日期……第一种情况是2020-12-23，后一种情况是2020-12-27。但我

浏览 0提问于2020-12-23得票数 0

回答已采纳

2回答

如何检查配置单元表列中是否存在字符串模式

hive、hiveql

我正在使用包含Hive-0.13.1的Cloudera集群进行日常活动。我随身携带的字符串模式很少，我需要找出这些模式是否存在于Hive表中的某一列中。例如:我的字符串模式是板球运动员的简称，比如"Dravid"，"Sachin"，"Ganguly“。我在蜂巢里有一栏，里面有所有板球运动员的全名。 select full_name from players limit 3; Rahul Dravid Sachin Ramesh Tendulkar Sourav Ganguly 我需要将字符串模式与查询返回的值进行比较，如果匹配，则使用"Y“

浏览 0提问于2018-04-17得票数 0

1回答

Hive/SparkSQL -表达式中从日期到时间戳的类型强制

apache-spark、hive、apache-spark-sql、apache-spark-2.0

当我在Spark中运行Hive查询时，LHS (timestamp) <= RHS (date)对于相同值的'2013-09-30' 并不是相等的。而RHS中的CAST of TIMESTAMP效果很好。 > SELECT CASE WHEN CAST(ADD_MONTHS(CAST('2013-09-30' AS DATE), +1) AS TIMESTAMP) <= ADD_MONTHS(CAST('2013-09-30' AS DATE), +1) THEN 'les

浏览 4提问于2016-11-01得票数 2

回答已采纳

1回答

在雅典娜中创建带有分区的外部表会导致空表。

amazon-web-services、amazon-s3、amazon-athena、presto

我有一个s3位置，其中有一个按日期列分区的拼花表。 parquet_data --- -- dt=2021-07-27 files -- dt=2021-07-26 files 现在我想创建一个外部表(CETAS) 使用由dt列分区的表。 CREATE EXTERNAL TABLE IF NOT EXISTS database.tbl_name ( ACCOUNT_NUM bigint , ID

浏览 3提问于2021-07-27得票数 0

回答已采纳

1回答

宏未返回预期结果

hadoop、macros、hive、hiveql

我使用Hive临时宏来帮助进行日期代数(在本例中是前一个月的第一天)，并且得到了意想不到的结果。创建临时宏month1st_sub(dt日期) 铸(凹槽) 案例当月份(Dt)=1时，则转换为(年份(Dt)-1为字符串) 其他转换(年份(Dt)为字符串) 结束， "-“ 案例当月份(Dt)=1，然后"12“ 其他转换(月份(Dt)-1为字符串) 结束， "-01“ )作为日期) ；当我使用包含max_dt单个值的vars表(8-15-2014)测试此宏时，使用如下方法：选择 max_dt， month1st_sub(cast("2013-1-1

浏览 2提问于2014-09-01得票数 0

1回答

无法在DSE6.7中创建SparkSession

scala、apache-spark、cassandra、datastax、spark-cassandra-connector

我已将DSE 5.1升级为DSE 6.7。我们使用支持火花的分析节点来执行火花作业。我使用以下方法创建sparkSession对象： SparkSession .builder() .appName("App Name") .config("spark.cassandra.connection.host", "host") .config("spark.cassandra.connection.port", "port") .config("spark.cassandra.auth.u

浏览 0提问于2018-12-21得票数 4

回答已采纳

2回答

如何使用子查询在配置单元中进行连接？

hive、subquery

我使用的是hive 1.2.1，在尝试使用子查询连接时遇到了一些问题。我的主表是应用程序，我正在尝试根据帐户和日期将其加入到表信用中。当我尝试只获取一行时，日期条件给我带来了麻烦(信用必须在应用程序之后，并且它只能是一个，以避免连接中的受骗)。我使用了以下代码： SELECT COUNT(1) FROM applications apps LEFT JOIN credits c ON c.python_id = ( SELECT p

浏览 4提问于2019-02-09得票数 0

回答已采纳

1回答

对于同一外部表，Count(*)在spark.sql()和配置单元中给出不同的值

apache-spark、hive、pyspark

我正在使用hive和spark开发一个AWS集群。前一天，当我在hive中的外部表上运行一些ETL pyspark脚本时，我遇到了一个奇怪的情况。我们有一个控制表，它有一个提取日期列。我们正在根据提取日期过滤来自临时表( hive中的托管表，但位置是s3存储桶)的数据，并将其加载到目标表，该目标表是包含位于s3存储桶中的数据的外部表。我们正在装入如下表格 spark.sql("INSERT OVERWRITE target_table select * from DF_made_from_stage_table") 现在，当我通过spark和直接配置单元CLI检查了目标表的

浏览 20提问于2019-04-28得票数 0

2回答

OOZIE蜂巢作用中的参数类型不匹配

hive、oozie

我在oozie中运行hive操作，其中hive.sql脚本有下面提到的蜂巢查询。议程：目标是将此查询的结果插入到hive集成的hbase表中，其中的主要目标是通过transaction_dt列检索最新的时间戳。但是，当我在OOZIE中通过hive操作运行相同的查询时，它将失败错误信息： org.apache.hadoop.hive.ql.parse.SemanticException:第0行：-1参数类型不匹配的'rows'：EQUAL的第一个参数被期望为基本类型，但是list被找到这里似乎不需要UDF定义的变量，但是需要原始类型。当我在

浏览 0提问于2019-06-07得票数 1

2回答

星火SQL抛出错误"java.lang.UnsupportedOperationException:未知字段类型:空“

hadoop、apache-spark、hive、apache-spark-sql

当创建一个列值默认值为NULL的表时，我在Spark(1.6) SQL中获得了下面的错误。示例:将表测试创建为select column_a，NULL作为column_b从test_temp创建；同样的东西在Hive中工作，并创建数据类型为"void“的列。我使用空字符串而不是NULL来避免异常和新列获取字符串数据类型。是否有更好的方法使用spark在hive表中插入空值？ 2017-12-26 07:27:59 ERROR StandardImsLogger$:177 - org.apache.hadoop.hive.ql.metadata.HiveException: jav

浏览 3提问于2017-12-27得票数 0

回答已采纳

2回答

Informatica PowerCenter中筛选器中以前的工作流启动时间作为开始日期

lookup、transformation、informatica、informatica-powercenter

好的，情况如下:我有一个工作流，它运行许多映射。在这些映射中，我需要一个过滤器来设置一定的增量加载时间，以便将数据从salesforce迁移到oracle数据库。对于数据的初始加载，我们设置了一个过滤器，如下所示： CreatedDate >= TO_DATE('01/01/1900','MM/DD/YYYY') and CreatedDate <= $$EXPORTDATE 其中，$$EXPORTDATE分配给工作流管理器中的工作流变量，该变量引用WORKFLOWSTARTTIME。现在，对于重新迁移数据的增量加载，我需要使用上一次运行的开始时间作

浏览 0提问于2021-04-12得票数 1

回答已采纳

2回答

如何修复ORA-00933:使用sqoop未正确结束的SQL命令

oracle、hive、sqoop

我试图使用SQOOP将数据从Oracle导入到hive中。我读过同样错误的线程，它似乎解决不了我的问题。这是我使用的命令 sqoop import --connect jdbc:oracle:thin:@connection --query "SELECT * FROM ACTB_HISTORY WHERE trn_dt>='01-09-2021' and trn_dt<='01-08-2022' $CONDITIONS"; --username stg_uat -P --target-dir \user\hive\wareho

浏览 18提问于2022-08-02得票数 2

回答已采纳