尝试使用`TABLE_NAME.insert`向已分区表中插入数据时，在单分区insert语句中获取到` `Mispartitioned in single-partition insert statement`

sql、oracle、oracle11g

我使用一条sql语句将数据插入到要存档的表中，但我需要一条merge语句按月运行一次，以便用在旧表(1)中更改的任何数据更新新表(2)，这些数据现在应该移到存档中。问题的一部分是从旧表中删除移动的数据。我的insert没有这样做，但我需要将它放到从原始表中清除已保存数据的位置。是否有一条sql语句可以以这种方式将数据从一个表移动到另一个表？或者它需要是一个两步操作？最初的语句根据年龄和其他一些相关因素移动数据。插入内容为： INSERT /*+ append */ INTO tab1 SELECT * FROM tab2 WHERE (Postingdate < TO_

浏览 1提问于2011-12-29得票数 4

1回答

与表锁定有关的火花蜂巢插入

hadoop、apache-spark、hive

只是一个简单的问题。我正在尝试使用1.6.0版本的Spark程序，该版本利用了Hive表上的并发加载。在insert中使用hiveContext.sql("insert . . .")语句是一种可行的方法，因为我希望在编写过程中确保表锁定，因为根据我在statement中看到的，在使用DataFrame保存操作时，没有确保表锁定和原子性。 “保存操作可以选择使用SaveMode，它指定如何处理现有数据。重要的是要认识到，这些保存模式不使用任何锁定，也不是原子性的。此外，在执行覆盖时，在写入新数据之前将删除数据。” 在访问/插入数据到指定的单元表时，我如何确保存储表的原子

浏览 0提问于2017-09-20得票数 0

回答已采纳

1回答

PostgreSQL创建具有现有行和引用完整性的表分区

postgresql

我试图用PostgreSQL10.8中的现有行对表进行分区。结构如下：我正在尝试创建表Item的分区，它大约有5 has的行。我使用以下命令创建分区： CREATE TABLE item_1 (CHECK (id >0 AND id <1000001)) INHERITS (item); CREATE TABLE item_2 (CHECK (id >1000000 AND id <2000001)) INHERITS (item); ... 然后，规则： CREATE RULE item_1_rule AS ON INSERT TO item WHERE (

浏览 1提问于2019-12-11得票数 3

回答已采纳

1回答

表空间中的ibm db2创建索引不工作。

db2

我在db2 11.5上创建了一个数据库，然后创建了表空间，然后创建了一个表。目前一切都还好。但是，当我试图在新创建的TABLESPACE中创建索引时，它会抱怨语法错误： CREATE INDEX SCH.TBL_PMT_ERR_NIX01 ON SCH.TBL_PMT_ERR (PMT_NO ASC, PMT_ERR_ID ASC) in TBS_EC_SINDEX; 有错误： DB21034E The command was processed as an SQL statement because it was not a valid Command Line Processor com

浏览 9提问于2022-09-15得票数 0

回答已采纳

1回答

基于插入日期的Sql Server 2008分区表

sql、sql-server、database、bulkinsert、partitioning

我的问题是关于SQL Server2008中的表分区。我有一个程序，每隔10分钟左右就会将数据加载到一个表中。每天大约4000万行。数据被bcp‘’ed到表中，并且需要能够非常快地加载。我想根据数据插入到表中的日期对该表进行分区。每个分区将包含在特定日期加载的数据。该表应该保存最近50天的数据，因此每天晚上我都需要删除任何超过50天的分区。我希望有一个进程，每小时将加载到当前分区的数据聚合到一些聚合表中。摘要将仅在最新的分区上运行(因为所有其他分区都将被汇总)，因此它在insert_date上分区非常重要。通常在查询数据时，会指定插入日期(或多个插入日期)。通过从汇总数据中向下钻取

浏览 0提问于2014-01-07得票数 3

1回答

在少数情况下，Hive插入覆盖截断表。

hadoop、hive、hiveql、hadoop-partitioning

我正在研究一种解决方案，发现在某些特殊情况下，hive insert overwrite 会截断表，但在少数情况下它不会。有人能解释一下它的行为吗？为了解释这一点，我是表二表，源和目标，并试图使用insert overwrite将数据从源表插入到主表中。当源表有分区时如果源表有分区，并且您编写的条件是分区不存在，那么它不会截断主表。 create table source (name String) partitioned by (age int); insert into source partition (age) values("gaurang", 11); cre

浏览 0提问于2018-05-31得票数 2

1回答

用Spring数据插入Postgresql分区表？

postgresql、spring-boot、spring-data-jpa

如何在Postgresql分区表中插入/保存Spring数据？在postgresql数据库中，如果分区不存在，则会有一个触发器创建该分区，然后将其插入子表中的数据库中。 /* table division logic */ EXECUTE 'INSERT INTO tableA.'|| partition_name ||' SELECT ($1).* ' USING NEW; RETURN NULL; 当试图通过命令repository.save()在数据库中插入时，它将返回以下错误： org.hibernate.StaleStateException: Un

浏览 20提问于2021-12-06得票数 0

1回答

将数据插入带桶的蜂巢表中

sql、hadoop、hive、insert、sql-insert

关于在Hive的桶形表中创建/插入数据的建议。做了一些阅读()，并测试了几个选项，但没有成功。目前，在运行insert时，我会得到以下错误： Error while processing statement: FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask 创建代码： CREATE test_in ( id VARCHAR(250), field_1 VARCHAR(250), field_2 VARCHAR(250), field_3 VARCHAR

浏览 0提问于2019-08-01得票数 0

回答已采纳

3回答

如何插入和选择带分区表的数据？

postgresql、rules、partitioning

我在中为每个文档设置了一组分区表 CREATE TABLE t (year, a); CREATE TABLE t_1980 ( CHECK (year = 1980) ) INHERITS (t); CREATE TABLE t_1981 ( CHECK (year = 1981) ) INHERITS (t); CREATE RULE t_ins_1980 AS ON INSERT TO t WHERE (year = 1980) DO INSTEAD INSERT INTO t_1980 VALUES (NEW.year, NEW.a); CREATE RULE t_ins_19

浏览 4提问于2010-06-19得票数 4

回答已采纳

1回答

Postgres在父分区表上长期运行的事务保持锁

database、postgresql、database-partitioning、postgresql-12、database-locking

TL;DR:我们有长期运行的导入，这些导入似乎在父分区表上持有锁，尽管没有任何东西直接引用父表。背景在我们的系统中，我们有inventories和inventory_items。库存通常有200 K左右的项目，我们的访问模式使用本机分区( Postgres 12)通过inventory_items对inventory_id表进行分区是有意义的。换句话说，每个清单都有自己的inventory_items分区表。这是通过以下DDL完成的： CREATE TABLE public.inventory_items ( inventory_id integer NOT NULL, /* ..

浏览 5提问于2021-04-08得票数 7

回答已采纳

1回答

不处理带有分区列的毫秒时间戳的BigQuery

google-bigquery

我有一个unix时间戳列，它在我的csv文件中以毫秒表示。现在，当我将这些数据插入我的bigQuery表并查询它时，我会得到以下错误现在，我想把这个列作为一个分区列。我有几个问题: 1)即使我将其保存为int64，如何在此字段上创建分区列? 2)我希望避免重复的表。

浏览 1提问于2018-05-11得票数 3

1回答

PostgreSQL复制命令内部

postgresql、postgresql-10、copy、batch-processing

我需要了解一些关于PostgreSQL 10中的copy命令的内部信息，特别是我需要知道是否copy from到远程数据库进行批处理插入。如果是，默认插入批次大小是多少？插入将使用一组包含n条记录的insert查询来执行？(n是默认的批处理大小)

浏览 0提问于2019-11-04得票数 2

回答已采纳

2回答

不工作在分区表上的PostgreSQL向上插入

postgresql、plpgsql、upsert

有一张这样的桌子： CREATE TABLE aggregated_master ( "user" BIGINT, type TEXT, date TIMESTAMP, operations BIGINT, amount NUMERIC, PRIMARY KEY ( "user", type, date ) ); 这个表是许多分区继承的主表。分区按月在日期字段中完成。例如:2017年8月的分区将是agg_201708，而它的PK将是pk_agg_201708，在插入之前通常会触发

浏览 0提问于2017-08-03得票数 10

回答已采纳

1回答

scala、apache-spark、databricks、voltdb、azure-databricks

我正在使用给定的insert语句创建一个VoltDB表 CREATE TABLE EMPLOYEE ( ID VARCHAR(4) NOT NULL, CODE VARCHAR(4) NOT NULL, FIRST_NAME VARCHAR(30) NOT NULL, LAST_NAME VARCHAR(30) NOT NULL, PRIMARY KEY (ID, CODE) ); 并使用以下命令对表进行分区 PARTITION TABLE EMPLOYEE ON COLUMN ID; 我已经写了一个spark作业来插入数据到VoltDB中，我正在使用

浏览 18提问于2019-01-24得票数 0

回答已采纳

1回答

大查询在从一个表插入另一个表时指定_PARTITIONTIME

google-bigquery

我有两个大查询表，t1和t2，这两个表都包含_PARTITIONTIME列。我的目标是将t2中的行插入到t1中，以维护_PARTITIONTIME 是否有一种INSERT将_PARTITIONTIME作为所选变量的方法？或者在插入行之后是否有追溯性定义_PARTITIONTIME列的方法？

浏览 5提问于2017-12-12得票数 2

回答已采纳

2回答

postgres对重复数据进行分区

postgresql、database-partitioning

我有一个transactions表： CREATE TABLE transactions ( id BIGSERIAL NOT NULL, amount BIGINT, value VARCHAR(200) NOT NULL, created_date TIMESTAMP WITH TIME ZONE DEFAULT now() ) PARTITION BY RANGE (created_date); 现在我正在创建两个分区

浏览 7提问于2021-07-17得票数 1

1回答

bigquery蒸缓冲区持续多长时间？

google-bigquery

目前，我正在将数据从sql服务器数据库系统迁移到bigquery，在尝试使用活动流缓冲区从bigquery表中删除记录时遇到了一个问题，您能确认一个流缓冲区在被删除之前持续了多长时间，这样delete操作才能对它运行吗？我发现这在开发过程中造成了不必要的不便。非常感谢你的帮助，我期待着收到你的来信。诚挚的问候,

浏览 8提问于2019-11-26得票数 2

回答已采纳

1回答

如何将Hive分区列和值插入数据(parquet)文件中？

hadoop、hive、parquet、impala、hadoop-partitioning

请求：-如何在将数据插入Hive/Impala表时将分区密钥对插入到每个parquet文件中。 Hive创建外部表db.tbl_name ( col1字符串，col2字符串)，该表被(date_col字符串)分区，存储为'hdfs_path/db/tbl_name‘。让我们将数据插入到这个单元表中。插入db.tbl_name分区(date_col=2020-07-26)值(‘test1 1_col1’，'test1_col2') 一旦记录被插入，让我们使用拼花工具或任何其他工具查看数据到拼花文件中。拼花工具猫hdfs_path/db/tbl_name/date_c

浏览 2提问于2020-07-22得票数 1

1回答

关于删除MSSQL中的大行集的建议

sql-server、delete、columnstore

我需要每天从一个包含大约35亿条记录的表中删除大约百万行75+。数据库恢复模式很简单，我已经写了一个代码，在一个时间条件下删除15.000行，直到所有75M记录都被删除。(由于日志文件增长，我使用批删除)但是，以当前的删除速度，看起来至少需要5天，这意味着需要删除的数据量比我的删除速度快。基本上，我要做的是总结(在另一个表中)并删除超过2个月的数据。该表中没有更新操作，只有插入和删除操作。我有MSSQL 2017企业版欢迎提出任何建议。表定义：(为您提供清晰的视图) 表有3个索引，聚集的bigint Id索引、非聚集的(Datetime + bit + int)索引和包含每个列的非聚

浏览 0提问于2020-06-24得票数 0

1回答

如果一个单元(0.13)、SELECT和INSERT覆盖同时运行，会发生什么？

hive

我想知道，如果一个蜂巢选择和插入覆盖同时运行会发生什么。请帮助我理解在以下情况下将返回什么蜂巢查询。在查询运行时，先运行查询，然后插入覆盖相同的表。首先运行INSERT覆盖，在覆盖时，使用SELECT从同一个表中提取数据。我们将得到旧的数据，新的数据，混合数据，一无所有，还是不可预测的数据？我使用的是MapR 4.0.1，Hive 0.13。诚挚的问候, 瑞安

浏览 3提问于2015-10-20得票数 7

回答已采纳

2回答

流到BQ分区表中

google-bigquery、google-cloud-dataflow

我正在尝试使用数据流来流到BQ分区表中。文件说：流缓冲区中的数据对于_PARTITIONTIME列具有空值。在将行插入日期分区表中时，我可以看到这种情况。是否有一种方法可以设置要插入的行的分区时间，以便BigQuery可以推断正确的分区？到目前为止，我尝试过这样做：tableRow.set("_PARTITIONTIME", milliessinceepoch);，但是我遇到了一个no such field异常。

浏览 1提问于2016-07-28得票数 1

回答已采纳

2回答

通过EMR在配置单元表中运行分析表计算统计信息时出错(配置单元2.0)

amazon-web-services、hive、amazon-emr

不确定这里的问题是什么，但仅仅是一个简单的分析表计算统计数据就抛出了下面的错误。我尝试了msck修复，但我觉得分区已损坏。可以在不删除分区的情况下执行任何操作吗？ [Code: 500051 , SQL State: HY000] [Amazon][HiveJDBCDriver](500051) ERROR processing query/statement. Error Code: 40000 , SQL state: TStatus(statusCode:ERROR_STATUS ,infoMessages:[*org.apache.hive.service.cli.HiveSQL

浏览 37提问于2021-07-07得票数 0

1回答

流到基于列的分区Bigquery表“不允许”？

google-bigquery、google-python-api

是否支持将数据流到列分区BigQuery表中？我有麻烦了，搞错了： BadRequest: 400post.$20180410/：不允许流到基于列的分区表...$20180410的元数据分区。它说，读取BigQuery 是允许流到分区表的，但所有示例都是针对最耗时的分区的。我没有看到对新的基于列的分区的引用。是支持还是我做错了？例如，当我显式添加分区后缀($YYYYMMDD)时会发生错误。当我不使用后缀时，写就成功了，但它看起来并不是实际分区的。下面是我的示例代码：我们有一个有几个列的表，让我们这样说： date: DATE (partitioned field) name:

浏览 0提问于2018-04-13得票数 1

回答已采纳

1回答

如何解决Postgres 11错误:无法将插入的元组路由到外部表

postgresql、database-partitioning、foreign-data-wrapper

我正在尝试用解释的分区和FDW示例。在创建FDW扩展和外部分区表(temperatures_2016)之后，当我尝试将2016年数据插入主表温度时，它会抛出错误:无法将插入的元组路由到外部表。我该怎么解决这个问题？ --在其他服务器上-- box2 CREATE TABLE temperatures_2016 ( at date, city text, mintemp integer, maxtemp integer ); -在我的服务器上 CREATE FOREIGN TABLE temperatures_2016 PART

浏览 3提问于2019-01-18得票数 1

1回答

在蜂箱/黑斑羚中使用负载数据加载数据

hive、impala

我可以使用以下命令将数据加载到蜂箱中： LOAD DATA INPATH '/xx/person/a.csv' INTO TABLE person PARTITION (age = 30); 在上面的语句中，age=30是必须存储数据的分区。如果a.csv实际上有年龄列呢？是否有一种方法可以使单元格使用一个LOAD数据语句正确地将每一行a.csv插入到正确分区下的person表中？

浏览 1提问于2016-09-01得票数 1

回答已采纳

1回答

分区表isse上的唯一索引

postgresql

如何消除postgres分区后的重复插入。由于分区键在唯一约束下导致非键属性重复。例:身份证日期 1 1-01-2022 1 02-01-2022 要使ID在insert触发器之前是唯一的选项，还有其他方法吗？

浏览 5提问于2022-01-20得票数 0

1回答

插入到已分区的表中需要很长时间

mysql、mysqli、bulkinsert、partitioning、load-data-infile

我的表结构如下： CREATE TABLE IF NOT EXISTS `dnddata` ( `numbers` varchar(10) NOT NULL, `opstype` char(1) NOT NULL, PRIMARY KEY (`numbers`) ) ENGINE=MYISAM DEFAULT CHARSET=latin1 /*!50100 PARTITION BY KEY (numbers) PARTITIONS 20 */; 当我将数据插入到这个表中时，花费了很长时间。插入300万条记录需要50分钟。我用过load data和insert into dndd

浏览 1提问于2012-07-18得票数 0

2回答

如何在hdfs将orc文件复制到该表的文件夹后更新该表的数据

hive、hdfs、orc

在将orc文件插入具有hdfs副本的表的文件夹中之后，如何在使用hive查询时更新该hive表的数据以查看这些数据。诚挚的问候。

浏览 3提问于2017-01-10得票数 0

回答已采纳

1回答

MySQL - "CREATE_OPTIONS“在"information_schema.tables”中？

mysql、innodb、information-schema

我有一个MySQL 5.7.16企业运行在一台Centos 6机器上，InnoDB是默认的存储引擎。我有大约300张桌子，其中大约90张是“列表”分区的。我的服务器配置中有innodb_stats_on_metadata=0选项。当我使用查询查询元数据时， SELECT * FROM information_schema.TABLES WHERE TABLE_sCHEMA = 'mydb'; 我可以看到列CREATE_OPTIONS对于一些非分区列是空的，对于一些非分区表是row_format=DYNAMIC，对于某些分区表是分区的，对于某些分区表则是row_format=

浏览 0提问于2017-10-05得票数 0

回答已采纳

1回答

如何使查询的结果作为输入进行分区？

hive、hiveql、create-table、hive-partitions、hiveddl

我是蜂巢的新手，所以一个基本的问题是:如何创建一个查询，以便以特定的方式对查询结果进行分区？例如： CREATE TABLE IF NOT EXISTS tbl_x ( x SMALLINT, y FLOAT) PARTITIONED BY (id SMALLINT) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS ORC; INSERT INTO TABLE `tbl_x` VALUES (1, 1, 1.0), (1, 1, 2.0), (1, 2, 3.0),

浏览 1提问于2019-04-04得票数 2

1回答

BigQuery中的合并语法是否扫描整个表？

google-bigquery

我使用MERGE语法对整个表使用两个表，即源表和目标表。任务是更新目标中的旧数据，并在选定的时间内从源添加新数据(有modified_time扫描)。问题是，我不希望合并扫描整个行，只关注我想要合并的内容。因此，我尝试使用以下查询： target trg USING source src ON trg.id = src.id AND trg.c_ctr = src.c_ctr AND DATE(trg.pt) = DATE(src.pt) AND DATE(trg.pt) >= "2019-12-12 WHEN MATCHED AND DATE(s

浏览 0提问于2020-01-07得票数 0

1回答

apache在每个rdd上启动运行任务

apache-spark、rdd

我有一个rdd，它在星火环境中分布在多台机器上。我想在这个rdd上的每个工作机器上执行一个函数。我不想收集rdd，然后在驱动程序上执行一个函数。对于每个rdd，应该在每个执行者上分别执行该函数。我该怎么做？更新(添加代码)，我正在运行所有这些在火花外壳 import org.apache.spark.sql.cassandra.CassandraSQLContext import java.util.Properties val cc = new CassandraSQLContext(sc) val rdd = cc.sql("select * from sams.even

浏览 5提问于2015-07-14得票数 1

回答已采纳

1回答

-如何选择/插入列较少的表？

azure、azure-data-lake

我有一个表，我想输出查询的结果。目标表的列比源表少。运行简单的insert select语句将导致以下错误： E_CSC_USER_INSERTTOOMANYCOLUMNSSPECIFIESPARTITION:单个分区INSERT语句的源包含比目标的实际列更多的项。说明:源列数不得超过实际目标表列数。不应在源行集中提供虚拟列。解析:将源的架构与实际(非虚拟)列匹配。我尝试使用一个视图，将列限制在正确的集合内作为中介，但这仍然会产生相同的错误。在数据湖分析中，如何将数据从一个表移动到另一个表，而我必须始终在两个表中都有相同的列？编辑：样品DDL 创建表： CREATE TAB

浏览 1提问于2018-01-09得票数 1

回答已采纳

1回答

使用流插入API保证BigQuery最终的一致性

google-bigquery、consistency、eventual-consistency

我想使用将行插入到BigQuery表中。在我的用例中，这是唯一将被执行的“写”操作的类；我不会以任何其他方式插入行，也不会更新或删除行。在读取了之后，我的理解是，即使在添加了insertAll请求之后，后续的读取操作可能也不会“看到”它成功插入的所有行，直到它们从流缓冲区传输到托管存储中为止。假设我的理解是正确的(如果不是，请告诉我！)：是否有任何方法能够判断由给定的insertAll请求插入的所有行都已提交到托管存储中？即使一行已被提交到托管存储，后续的读取操作是否保证看到它们，或者失败？我为什么要问这些问题？我的表模式将包含一个"key“列，它是一个严格单

浏览 0提问于2018-12-14得票数 2

回答已采纳

2回答

从DBLink插入的最佳方式- Oracle

oracle、optimization、query-optimization、database-link

我需要通过Dblink在我的数据库中插入1000万条记录。普通的insert语句insert into select * from是正确的还是最佳的方式？还能有什么其他选项来插入该卷的数据？我使用的是Oracle 11g。

浏览 4提问于2015-10-30得票数 0

1回答

带继承的分区

postgresql、partitioning、inheritance

参考资料：https://www.postgresql.org/docs/current/ddl-partitioning.html#:~:text=return%20an%20error.-,5.11.3.%C2%[…]20使用%20顺位，-While%20the%20built 我尝试使用继承进行分区，但是在子表中添加额外的列之后，当我尝试使用该范围直接在父表中插入数据时，我得到以下消息： insert into measurement values (2, '2006-02-02',4,5,'channa'); ERROR: INSERT has mo

浏览 0提问于2022-09-18得票数 0

1回答

表分区切换问题Server

sql-server、partitioning

我有过表模式： CREATE TABLE [dbo].[t1]( [id] [bigint] IDENTITY(1,1) NOT NULL, [id_file] [bigint] NOT NULL, [id_campo] [bigint] NOT NULL, [valor] [nvarchar](255) NULL, [id_doc] [bigint] NULL, [grupo] [bigint] NULL, CONSTRAINT [PK_valores_texto_test_id] PRIMARY KEY CLUSTERED ( [id] ASC )WITH (PAD_INDEX

浏览 0提问于2018-03-22得票数 1

回答已采纳

1回答

AWS S3 -插入到存储桶ORC表中

amazon-s3、amazon-athena、orc

我正在考虑将数据存储在ORC format中的S3中，以便使用Athena进行查询。我想像这样划分数据... .../year=2019/month=7/ ..。并通过id进一步对数据进行分类(每个id每个月都有多个记录，有很多id) 我希望能够每天将新数据插入到此结构中...我知道我不能从雅典娜使用INSERT INTO语句，因为不支持分桶表。将每天的数据插入到这种结构的表中的最佳方式是什么？是否有可能对存储桶数据进行处理？干杯

浏览 10提问于2020-01-23得票数 0

1回答

如何格式化或删除未被识别的SD卡？

mount、sd-card、gnome-disk-utility

我的处境与一个d3vid在里面相似。我试图重新格式化我的SD卡，因为我相信这是让我的电脑很难识别它的原因。Gnome磁盘实用程序可以识别SD卡，但是每次我尝试格式化该卡时，它都会返回一个新的错误。我在插入卡之前和之后运行了ls -la /dev/sd*，输出之间没有差别。就像电脑的某些部分可以识别出卡片，而另一些部分则不能. 当我试图在不覆盖内容的情况下将其格式化为FAT时，磁盘实用程序给出了错误Error creating file system: Command-line 'mkfs.vfat -I -n "RASP" "/dev/mmcblk0"&

浏览 0提问于2016-06-03得票数 0

6回答

未加载到单元格中的分区表中的数据

hadoop、mapreduce、hive、partition

我试图为我的表创建分区，以便更新一个值。这是我的样本数据 1,Anne,Admin,50000,A 2,Gokul,Admin,50000,B 3,Janet,Sales,60000,A 我想把Janet's部门更新为B。为此，我创建了一个以Department作为分区的表。创建由(部门字符串)行格式分隔的外部表跟踪(EmployeeID Int、FirstName字符串、指定字符串、工资Int)，分隔字段以“、”位置/用户/sreeveni/HIVE‘结束；但是在执行上面的命令时。没有数据插入到trail表中。 hive>select * from trail;

浏览 2提问于2014-09-18得票数 9

2回答

在配置单元中的分区级别添加列

hadoop、hive、hiveql

我是新的配置单元，我们有要求添加列到现有的配置单元表。我在下面命令的帮助下做到了这一点。alter table tableName add columns (colName数据类型)级联但在hive文档中，我们使用alter命令在分区级别添加列。我尝试了下面的命令。 hive> SET hive.exec.dynamic.partition = true; hive> alter table test_alter_col partition(c=1) add columns (d1 int); FAILED: Execution Error, return code 1 from

浏览 8提问于2018-09-27得票数 0

1回答

表分区的SQL拆分/合并:实现的最佳方法是什么？

sql-server、partitioning

微软在其关于更改SQL 2005分区的MSDN 中列出了几种可能的方法：使用所需的分区函数创建一个新分区表，然后使用insert INTO...SELECT from语句将旧表中的数据插入到新表中。在堆上创建分区聚集索引使用Transact-SQL CREATE语句和Drop = ON子句删除和重建现有的分区索引。执行一系列ALTER分区函数语句。你知不知道怎样才能最有效地建立一个大型数据库(数百万条记录)，它基于记录的日期(类似于每月的分区)，数据会在1-2年内传播？另外，如果我主要访问(阅读)最近的信息，那么在最后的X天中保留一个分区是否有意义，而其余的

浏览 2提问于2008-10-01得票数 0

回答已采纳

1回答

Oracle Insert the绑定JDBC中的分区名称

java、oracle、jdbc、partitioning

我正在使用JDBC将大量数据插入到表的不同分区中。该表是系统分区的，这意味着我需要在insert语句中提供分区名。 INSERT INTO T Partition P values (...); 我使用预准备语句绑定insert语句的值，现在我想知道是否也可以绑定分区名，因为在看到实际数据之前，我不知道需要插入哪个分区。

浏览 4提问于2013-05-29得票数 0

回答已采纳

1回答

postgresql中的分区

postgresql、ddl、database-partitioning

所有人！ Im在postgresql中是新的，并尝试对现有表进行分区。所以我想要的是 alter table t1 partition by range (c_date); 但是在分区或分区附近会出现语法错误。此外，我还试图添加start from并获得同样的错误。我可以在不创建新表的情况下分区表吗？

浏览 1提问于2021-08-31得票数 1

回答已采纳

5回答

用分区将数据从一个蜂巢表加载到另一个

hadoop、hive

我在一个Hive表中有数据，并且希望将数据加载到另一个hive表中。源表是reg_logs，它有两个分区，日期和时间。数据每小时加载到此表中。方案是： CREATE EXTERNAL TABLE IF NOT EXISTS reg_logs ( id int, region_code int, count int ) PARTITIONED BY (utc_date STRING, utc_hour STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' STORED AS TEXTFILE LOCATION '/

浏览 10提问于2014-06-13得票数 18

回答已采纳

1回答

Google :复制日期分区表所需的分区规范

google-bigquery

注意:这几乎是的重复，区别是在本例中源表是日期分区的，而目标表还不存在。而且，这个问题的公认解决方案在这种情况下是行不通的。我正在尝试将一天的数据从一个日期分区表复制到一个我还没有创建的新的日期分区表中。我希望BigQuery能够像通常对非日期分区的情况一样，为我创建日期分区的目标表。使用BigQuery CLI，下面是我的命令： bq cp mydataset.sourcetable\$20161231 mydataset.desttable\$20161231 下面是该命令的输出： cp操作中的BigQuery错误:错误处理作业‘myproject:bqjob_bqjob’：为了创建

浏览 7提问于2017-06-16得票数 5

回答已采纳

1回答

在链接表上创建分区视图

sql、sql-server、tsql、database-partitioning

我正在学习SQL Server中的分区表，我遇到了这个问题:我有两个链接表--父表和子表。其中一个(甚至两者都是)是一个分区表。在实现分区视图时，是否需要在其中包含两个相同的列--引用父表的列(来自子表)和引用的主键(来自父表)？因为MSDN说：列规则：每个成员表中的所有列都必须包含在选择列表中。选择* FROM是可接受的语法。但是视图应该使(链接)表的表示更容易，所以并不是所有的列都应该包含在视图中。在我的例子中，根据MSDN，我必须将两个表的所有列都包含到视图中(其中两个将是相同的)。在我看来，这似乎不是很合乎逻辑的解决办法。例如：数据库1： create table

浏览 2提问于2016-01-09得票数 1

回答已采纳

1回答

BigQuery批处理负载执行时间和频率

google-cloud-platform、optimization、google-bigquery

我正在考虑从Streaming insert切换到Batch loading以插入BigQuery。但是，我找不到一些我需要的信息。时间:假设我有一个有100万张唱片的csv文件。粗略地说，一次负载需要多长时间？我们是说几个小时还是几分钟？频率:我可以每10分钟左右做一次负荷工作吗？并发性:两个作业能同时发生吗?还是我需要等待前一个任务完成？

浏览 4提问于2022-07-29得票数 0

回答已采纳

1回答

从Postgres中的其他数据库构建表-(多服务器并行查询执行？)

postgresql、postgresql-10

我正在努力寻找建立数据库关系的最佳解决方案。我需要一些东西来创建一个表，其中将包含来自不同数据库的其他表的数据拆分。所有的表都有完全相同的结构(相同的列号、名称和类型)。在单个数据库中，我将创建一个带有分区的父表。然而，数据量太大，无法在单个数据库中完成，这就是我尝试进行拆分的原因。从Postgres文档中，我认为我正在尝试做的是“多服务器并行查询执行”。目前，我认为要实现的唯一解决方案是建立数据库地址的API，并在需要时使用它将数据通过网络传输到主父数据库中。我还发现了一个名为的Postgres外部扩展，它可能可以完成这项工作，但我不知道如何跨多个数据库实现唯一键(或者像Citus这样的

浏览 1提问于2018-12-03得票数 0

1回答

在Postgres 10中的分区表中插入带有onConflict子句的多行

postgresql、partitioning、upsert、postgresql-10

我在Postgres 10中有如下声明： INSERT INTO my_table(A, B) VALUES (val_A1, val_B1), ... (val_A99, val_B99) ON CONFLICT DO NOTHING; 它运行得很好，但后来我对我的表进行了分区，然后这个语句开始失败： org.postgresql.util.PSQLException: ERROR: ON CONFLICT clause is not supported with partitioned tables As

浏览 3提问于2019-02-06得票数 0