SQL Redshift:如何在基于另一个列值的联接中使用值

SQL Redshift是亚马逊AWS的一项数据仓库解决方案，用于处理大规模数据分析工作负载。它基于PostgreSQL数据库引擎，针对大数据处理和高性能查询进行了优化。

在Redshift中，可以使用基于另一个列值的联接来使用值。这可以通过使用子查询或使用JOIN语句中的子查询来实现。

使用子查询：可以将一个查询作为另一个查询的子查询，并将其结果用作联接条件中的值。以下是一个示例：
使用子查询：可以将一个查询作为另一个查询的子查询，并将其结果用作联接条件中的值。以下是一个示例：
在上面的示例中，子查询 (SELECT column3 FROM table3 WHERE table3.column4 = table2.column5) 返回一个值，该值用于将 table1 和 table2 进行联接。
使用JOIN语句中的子查询：可以在JOIN语句中使用子查询来联接表，并将子查询的结果用作联接条件中的值。以下是一个示例：
使用JOIN语句中的子查询：可以在JOIN语句中使用子查询来联接表，并将子查询的结果用作联接条件中的值。以下是一个示例：
在上面的示例中，子查询 (SELECT column3 FROM table2 WHERE table2.column4 = value) 返回一个值，并将其作为 subquery 表，然后将其与 table1 进行联接。

以上是使用SQL Redshift中基于另一个列值的联接中使用值的两种常见方法。这些方法可以根据具体的业务需求和数据结构进行调整和优化。

腾讯云提供了类似的数据仓库解决方案，您可以参考腾讯云的相关产品-云数据仓库CDW（Cloud Data Warehouse）了解更多信息：腾讯云云数据仓库CDW

页面内容是否对你有帮助？

有帮助

没帮助

使用python从AWS红移加载数据

、、、

我面临着一项任务，无法从Amazone Redshift中提取大量数据到另一个表。这肯定需要一种更有效的方法，但我对SQL和AWS并不熟悉，所以决定向这个聪明的社区征求意见。这是我最初的SQL查询，它要花费很长时间： -- STEP 1: CREATE A SAMPLE FOR ONE MONTH SELECT DISTINCT at_id, utc_time, name INTO my_new_table FROM s3_db.table_x WHERE type = 'create' AND (dt BETWEEN '20181001' AND '

浏览 0提问于2019-01-12得票数 0

1回答

如何在PostGresOperator airflow中传递.sql文件中的参数？

、、

我有一个sql文件，我想使用PostGresOperator将参数传递给这个sql文件。 """select * from table_{} where id > ID """.format(mytable,myID) 我的postGresOperator mport_redshift_table = PostgresOperator( task_id='copy_data_from_redshift_{}'.format(country), postgres_conn_id

浏览 44提问于2021-08-29得票数 0

回答已采纳

1回答

需要将偏移值作为expr包含在滞后函数中

、、

我正在将Redshift SQL迁移到snowflake SQL。需要建议如何在雪花的LAG()中包含偏移值作为表达式。关于偏移量，Redshift支持在LAG()中的表达式，而snowflake不支持。例如:期望SF中的sql： LAG(exp, **exp**) over (partition by col1 order by col2)

浏览 0提问于2020-09-30得票数 0

1回答

如何在Redshift中将日期字符串从' 2017 -05- 20‘格式更改为'May 20 2017 12:00AM’？

、

在Redshift中查找SQL查询以更改日期格式。我有一个列需要更改为新格式，并插入到另一个‘5月20日12:00AM’格式的表中。提前感谢！

浏览 7提问于2017-06-17得票数 0

1回答

即使在同时为Dist键和排序键的列中加入时，仍在执行散列连接

、、、、

我在Redshift中有一个事实表，大约有13亿行，其中包含DISTribution键c1和排序键c1，c2。我需要在c1上用一个join子句连接这个表(即表的第一个实例的c1 =表的第二个实例的c1 )。当我看到查询的查询计划时，Redshift似乎正在使用DS_DIST_NONE进行哈希连接。虽然DS_DIST_NONE是预期的，因为我在列c1上有dist键和排序键，但是我希望Redshift执行合并连接，而不是Hash (同样是因为同样的原因)。我相信这会减慢我的查询速度。请解释一下，为什么Redshift可能会执行Hash连接而不是合并连接(即使我在连接列中同时有DIST键和排

浏览 8提问于2015-03-31得票数 2

回答已采纳

2回答

亚马逊红移-默认的连接是什么？

、

在中默认的“连接”是什么？当我没有指定任何方向时，Redshift是否使用内、左、右或外连接？

浏览 4提问于2017-10-26得票数 4

回答已采纳

1回答

红移DISTKEY /

、、

对于Redshift如何在内部处理DISTKEY和SORTKEY以满足存储层和查询执行需求，我有一个非常技术性的问题。我读过这个令人惊叹的，它很好地解释了每个关于表设计的意义。我的问题是，假设我有一个有三列的表A： CREATE TABLE ( orderdate timestamp distkey, product_id varchar(50), product_name varchar(250) ) SORTKEY (product_id) 现在，我们知道Redshift是一种为数据仓库优化的柱状方法DB。在我的示例中，很明显，数据在计算节点的片间分布的方式可能是基于DISTKEY顺序的

浏览 0提问于2018-10-19得票数 19

回答已采纳

1回答

AWS SCT :哪种Redshift数据类型等同于SQL Server的datetime？

、、

我们正在尝试通过AWS SCT (模式转换工具)将DWH从当前的SQL Server 2016迁移到AWS Redshift。我们的SQL Server表有'datetime'(YYYY-MM-DD hh:mm:ss.000)列。它们通常由SCT在模式级别转换为Redshift时间戳列。但SCT数据提取代理将数据复制到Redshift失败。(提取的数据已成功上传到S3) 我想这是由于datetime类型的差异，即使我相信Redshift timestamp允许秒刻度到6位。如果你对此有任何解决办法，请让我知道如何转换他们没有任何问题。 Sachiko，Sincerly

浏览 1提问于2018-09-14得票数 0

3回答

如何在Redshift上执行sql文件

、、

我有一个SQL文件，它有几个临时创建脚本和几个插入脚本。我们希望使用AWS服务在Redshift上执行此SQL文件。

浏览 5提问于2018-11-26得票数 4

1回答

红移:数值数据溢出(结果精度)

、、、

嗨，我有一个Redshift DB，正在尝试将表“扫描”/列"net_rate“(数据类型为数字)中的数据插入另一个表"visits_by_scan”/列"scan_cost“(数据类型为数字)。我使用的查询如下： insert into visits_by_scan (scan_cost) select sum(cast(s.net_rate as decimal(30,4))) from scans s 当我试图运行此查询时，会收到以下数字溢出错误消息：如何插入数据而不出现任何错误？任何帮助都是非常感谢的。

浏览 2提问于2020-10-30得票数 2

2回答

如何将数据集列表转换为红移中的一组行

我有一个上传到Redshift数据库表中的两列的数据集： {A, 1|2|3|4} 加载到表中后，我需要将其转换为一组行，并将其插入到另一个表中： {A, 1},{A,2},{A,3},{A,4} 我想知道Redshift中是否有我可以使用的特定函数，或者是否有人编写了特定的SQL计划来执行这种类型的转换。任何帮助都是非常感谢的。注:第二列中的数据可以从1个数据点到1000个数据点不等。

浏览 1提问于2016-11-26得票数 0

1回答

Google BigQuery/ Amazon Redshift使用基于列的关系数据库还是NoSQL数据库？

、、、

我仍然不太清楚基于列的关系数据库和基于列的NoSQL数据库之间的区别。 Google BigQuery支持类似SQL的查询，那么它怎么可能是NoSQL呢？我所知道的基于列的关系数据库有InfoBright、Vertica和Sybase IQ。我知道的基于列的NoSQL数据库是Cassandra和HBase。下面这篇关于Redshift的文章以说"NoSQL“开始，但以使用PostgreSQL (关系)结束：

浏览 1提问于2015-01-20得票数 11

回答已采纳

1回答

同一列上的多个索引以提高搜索速度

、

我在做一个网络爬虫。为了防止爬行重复的url，我在列中存储了任何url的MD5。为了快速搜索MD5值，我在md5列上创建了一个索引。由于我不知道md5上的和DESC之间是否有任何区别，所以我已经将索引的排序顺序设置为 ASC 。我的问题是，如果用DESC顺序在同一列上定义另一个索引将提高搜索速度？当同一列上有多个索引时，数据库引擎(在我的例子中使用的是SQL server 2016)是否在同一列中启动两个并行搜索？

浏览 10提问于2020-03-15得票数 0

2回答

DB2优化大型IN谓词

、、

我有一个包含超过3亿条记录的表，其中只包含键、源和散列值。应用程序的内置sql在其sql中的哈希值上运行大型IN谓词以获取data.The sql执行缓慢，因此需要有关如何提高sql性能的建议。我不能更改sql，因为它是已经内置在应用程序中的内部sql。到目前为止，我已经尝试在键上放入一个索引，并在散列上放入另一个索引，但没有提供太多帮助。

浏览 0提问于2018-04-16得票数 0

3回答

无效操作:关系information_schema.sequences不存在(SpringBoot + RedShift )

、、、、

我正在尝试在我的Spring Boot应用程序中建立与Redshift数据库的连接。我的属性文件中有以下条目。 spring.datasource.driver-class-name=com.amazon.redshift.jdbc41.Driver spring.datasource.url=jdbc:redshift://redshift_url/db_name spring.datasource.username=username spring.datasource.password=password spring.datasource.testWhileIdle = true spr

浏览 155提问于2019-11-19得票数 0

1回答

在Redshift维度表中创建默认值行以防止报表中的空值

、

我正在通过数据仓库模式和默认数据负载(用于初始开发的MySQL )移植到Redshift进行生产。初始默认数据是在维度表中作为一行创建的，按照每个，自动增量列中设置的值为-1。在将模式移到Redshift时，应将该列从auto_increment更改为identity，以保留数据库主键生成，但这不再允许插入身份列返回 ERROR: cannot set an identity column to a value SQL state: 0A000 ETL加载作业应该负责在此实例中自动递增维度键，还是还有其他任务来创建insert值？

浏览 1提问于2016-06-22得票数 1

回答已采纳

2回答

从表A中删除连接到Redshift中的表A

、、

我正在尝试用PostgreSQL 8.0编写以下MySQL查询(具体地说，使用Redshift)： DELETE t1 FROM table t1 LEFT JOIN table t2 ON ( t1.field = t2.field AND t1.field2 = t2.field2 ) WHERE t1.field > 0 PostgreSQL 8.0不支持DELETE FROM table USING。中的示例表明，您可以在where子句中引用其他表中的列，但这在这里不起作用，因为我正在连接要从中删除的同一个表。另一个示例是子选择查询，但我正在处理的表的主键有

浏览 1提问于2014-05-01得票数 6

回答已采纳

1回答

在spark中连接多个jdbc连接表的最佳方法是什么？

、、、、

我正在尝试将一个查询迁移到pyspark，并需要将其中的多个表连接起来。所有有问题的表都在Redshift中，我正在使用jdbc连接器与它们对话。我的问题是如何优化这些联接，而不需要读取太多的数据(即加载表和键上的联接)，并且不只是公然地使用： spark.sql("""join table1 on x=y join table2 on y=z""") 是否有一种方法可以将查询推倒到Redshift，但仍然使用Spark来编写逻辑，同时也可以使用火花上下文中的df，而不将它们保存到Redshift中，只用于联接？

浏览 2提问于2020-01-30得票数 2

1回答

字符串类型数组之间的“困难”连接

、

我为这个奇怪的标题道歉。我不完全确定这在类似sql的(redshift)中是可行的，但我们可以试试。我有两张桌子。一个(名为asm)具有类似的内容(所有类型都是文本)： hashid kuids 00009fff755fb6cafbfe1d3262d0a6d4 [LDydc6kP, LBzCi_CB, LBrFy7Ot] 000bcb9ce17770ebb981e761ca71d395 [K2zw2pRu, LBbGkhWm] 另一个名为la的名字是： kuid lakuids LDydc6kP [KEqeQBJ8,

浏览 1提问于2017-08-31得票数 0

2回答

将从游标中取出的行存储在红移中

从游标中获取下一行->从游标返回下一行。在Redshift中，如何将其添加到变量中，或者是否可以将获取的游标数据插入到另一个表中。在Redshift中也可以使用for循环吗？

浏览 4提问于2017-08-06得票数 1

回答已采纳

1回答

红移select * vs select单列

、

我遇到了以下Redshift性能问题：我有一个大约20亿行的表，它有大约100个varchar列和一个int8列(intCol)。表是相对稀疏的，尽管有一些列在每一行中都有值。以下查询： select colA from tableA where intCol = ‘111111’; 返回大约30行，运行速度相对较快(~2分钟) 但是，查询： select * from tableA where intCol = ‘111111’; 需要一段时间( 60分钟后放弃)。我知道修剪投影中的列通常更好，但此应用程序需要整行。问题：这仅仅是在Redshift中做的一件根本不好的事情吗？如果不

浏览 0提问于2016-02-10得票数 3

1回答

在DAG中，如何在表中找到列主键并测试是否有空值？

、、

我在DAG中写了一个DataQualityOperator。它应该检查红移表中是否有数据。为此，我想检查主列是否包含空值。使用sql，我找到了列主键的名称。如何检查它是否包含空值？(这意味着在我的例子中，这个表不是很好)。 class DataQualityOperator(BaseOperator): check_template = """ SELECT a.attname FROM pg_index i JOIN pg_

浏览 22提问于2020-04-24得票数 1

2回答

当第一个表中的列值与第二个表中的列值匹配时，显示一个表中的数据

、、

我真的很难接受这一点。我有两个不同的表，即“离开”和“编辑数据”。当离境的"Name“列中的数据与editor_data的”when“列中的数据匹配时，我想要显示离境的数据。我已经尝试了下面的SQL查询，但它不能正常工作。 <?php SELECT Time, Location, Name FROM departure JOIN editor_data ON departure.Name = editor_data.ven ?> e.g 离境表的"Name“字段中可以有mike或rite。因此，如果"editor_data“在"v

浏览 6提问于2015-07-24得票数 0

1回答

python单元测试补丁模拟方法不返回返回值

、、、

我正在尝试编写一个测试用例test_is_user_present()，它从redshift_util.py脚本调用另一个函数execute_redshift_sql() 我将函数execute_redshift_sql()的预期返回值设置为1。但是，在调用函数之后，我永远不会从结果中得到这个值！我还打印了一些用于调试的值。您可以查看下面的测试用例。 from mock import patch, Mock, MagicMock from cia_admin_operations.redshift_util import execute_redshift_sql @patch(&#

浏览 1提问于2020-03-27得票数 3

回答已采纳

1回答

如何在Amazon Redshift中将列从字符串更改为日期？

、

初学者在这里，已经到处寻找这个答案，但它在Amazon Redshift的SQL中不起作用。我有一个日期列，格式为YYYYMM，etc 202101 =2021年1月。我想把它转换成像2021-01或01/2021这样的日期格式，除了日期格式外，哪个都行。如果我可以添加一个列，而不是替换原来的列，这是最好的。但大多数答案都是关于表的，但我使用的是视图。 select CONVERT(DATA_PERIOD , '01') FROM view LIMIT 10 DATA_PERIOD的示例数据 DATA_PERIOD 202101 202101 202102 202102

浏览 87提问于2021-05-07得票数 1

回答已采纳

1回答

左连接到现有表

、

我在我的数据库中有一个表A，我想通过从另一个表B中添加新列来修改它。我遇到的问题是，如果我创建一个新的表或者没有表，那么左边的join就能很好地工作。例如，以下查询工作： select * from TABLE_A left join TABLE_B on TABLE_A.ID=TABLE_B.ID 但是，当我使用alter时，会收到一条错误消息。下面的行生成一个错误消息1064 (SQL语法错误)： alter TABLE_A as select * from TABLE_A left join TABLE_B on TABLE_A.ID=TABLE_B.ID 或 alter TABLE_A

浏览 0提问于2015-11-19得票数 3

回答已采纳

2回答

动态框架写入额外的列

、、

我有一个粘合任务，从S3读取数据，对数据运行几个SQL查询，然后将数据输出到Redshift。我遇到了一个奇怪的问题，在(使用glueContext.write_dynamic_frame.from_options)向Redshift写入dynamic_frame时，会创建新的列。这些是我现有的一些列，类型附加到了末尾。例如，如果我的框架架构如下： id: string value: short value2: long ts: timestamp 在Redshift中，我看到： id varchar(256) value: smallint <---- The data here

浏览 0提问于2019-04-26得票数 4

1回答

在Amazon中使用自定义QuickSight时，join在哪里执行？

、

我在亚马逊QuickSight中使用自定义SQL连接来自RedShift的几个表。我想知道连接发生在哪里，QuickSight是将查询发送到RedShift集群并返回结果，还是在QuickSight中进行连接？我想在RedShift中创建一个视图，并从视图中选择数据，以确保连接发生在RedShift中，但是，在少数文章中读到在RedShift中使用视图不是一个好主意。

浏览 1提问于2021-01-09得票数 0

回答已采纳

1回答

如何在Redshift SQL中从单行创建多行

我想根据AWS Redshift中表格中的一列将表格中的单行扩展为多行。以下是我的示例表模式和行： CREATE TABLE test ( start timestamp, -- start time of the first slot slot_length int, -- the length of the slots in minutes repeat int -- how many slots will be there ); INSERT INTO test (start, slot_length, repeat) VALUES ('2019-09

浏览 0提问于2020-02-15得票数 0

3回答

从一个表到另一个数据库表中的另一列的MySQL比较列

下面是我试图用SQL查询完成的一些伪代码。 SELECT * FROM [table] WHERE id=[column in another database] 如何将另一个数据库的列值与正在运行查询的列值进行比较？

浏览 2提问于2015-03-22得票数 0

回答已采纳

1回答

ODBC调用违反主键失败

、、、

( SQL的初学者，所以我为我所犯的任何新手错误道歉) 所以从本质上讲，我目前正在制作一个访问表单，允许用户更新仓库中的库存。我使用ODBC link数据库，在其中我可以在服务器中存储各种数据(数据库的配置将在下面看到)，但是，当我创建一个链接到列(IDDH)的组合框时，每当我切换到另一个column.At时，它都会自动弹出一个错误，声明它违反了PK约束。此时我不知道我做错了什么，因为我已经在SQL中连接了两个表，并在Microsoft Access上连接了它(只是以防万一)。并在dbo.DonHang表(ProductID)中连接外键下面是我的配置SQL： ? Access中的关系

浏览 13提问于2020-09-08得票数 0

2回答

如何在Amazon中将数据从表加载和转换到另一个表？

、、、

我正在将数据从S3加载到Redshift数据库，现在需要在该表上执行ETL，并且在过滤数据之后，加载到Redshift中另一个模式中的另一个表中。如何在Redshift中将数据从一个表加载和转换到另一个表？我有两个暂存模式和一个用于报表的模式。但是，在将数据从暂存加载到reporting表之前，我希望删除重复的数据并更正一些数据，比如时间戳和日期。

浏览 3提问于2022-01-31得票数 0

1回答

如何根据字符串为条目生成数字标识符

、

我使用Redshift SQL语法，并想知道如何将表中每个条目的字符串id转换为数字id (因为表之间的数字联接应该比字符串联接快得多，效率也更高)。当前，ids看起来是这样的--一串同时包含数字和字母的字符串。 01r00001ABCDeAAF 01r00001IJKLmAAN ... 01r00001OPQRtAAN 我想要的是将其转换为一个纯粹的数字标识符，使用字符串id作为输入，并确保每个输出都是唯一的，并且只对应于单个输入而不发生冲突(可以跨表复制，以便能够进行准确的连接)。我尝试在SQL中对列使用一些散列函数，比如校验和()和BINARY_CHECKSUM()，但我有点不清楚在

浏览 1提问于2019-08-12得票数 0

回答已采纳

1回答

varchar(max)的红移负数

因此，我将sql server列标记为货币符号的nchar(1)，移植到redshift会失败，因为unicode是一个3字节的unicode字符，所以在redshift中需要char(3) (从技术上讲，没有nchar)。因此，我想切换我的etl解决方案，将所有varchar列创建为varchar(max)。在Redshift中，使用varchar(max)代替varchar/varchar(100)/etc有什么缺点吗？

浏览 2提问于2020-06-26得票数 2

3回答

设置关闭连接通用SSLEngine时亚马逊500150错误

、、

在连接到 RedShift时，我得到以下错误： 2016-04-14 13:49:30 ERROR SQL Exception when connecting [Amazon](500150) Error setting/closing connection: General SSLEngine problem. java.sql.SQLException: [Amazon](500150) Error setting/closing connection: General SSLEngine problem. at workbench.db.DbDriver.connect(DbDr

浏览 6提问于2016-04-14得票数 8

1回答

图形可视化-海量数据的性能问题

、、、

我有来自不同DB来源的大量数据(甲骨文、蒙戈、卡桑德拉)，也有卡夫卡提供的数据。使用Tableau进行分析，面对海量数据的性能问题。因此，计划以其他方式存储数据，并使用Tableau进行可视化。现在有多个选项，需要一些帮助才能最终确定方法。选项1:- 读取DB数据并将其存储在Parquet文件中，然后通过Spark或HiveQL或Presto公开它，并让Tableau连接到此SQL。选项2:- 读取DB数据并将它们存储在S3中的Parquet文件中，然后使用AWS雅典娜进行分析，让Tableau连接到雅典娜。选项3:- 读取DB数据并将它们存储在S3中的Parquet文件中，然后移动到R

浏览 2提问于2020-10-09得票数 0

1回答

红移可以避免使用排序键和连接表进行全表扫描。

、

我在Redshift中有一个非常大的表"event“，还有一个小得多的表"d_date”表示日期。Redshift将对下面的SQL运行完整的表扫描，除非我取消注释注释部分。表事件的排序键为date_id。为什么Redshift不知道先扫描d_date，然后通过匹配值限制事件表扫描要便宜得多呢？ select d_date.date_id, count(*) from d_date join event on d_date.date_id = event.date_id where d_date.sqldate > '2016-06-03' /* with

浏览 3提问于2016-06-03得票数 1

回答已采纳

3回答

Redshift:从字符串执行动态查询

、、

我想在Amazon Redshift上执行存储在字符串字段中的动态SQL查询。我的背景主要是T-SQL关系数据库。我过去常常动态构建SQL语句，将它们存储到变量中，然后执行它们。我知道Redshift可以准备和执行语句，但我想知道是否可以执行存储在字符串字段中的查询。我有一段代码，它使用pg_*系统表在几个表上动态构建下面的代码。每一列/表名都是动态计算的。以下是查询输出的示例： SELECT h_article_id AS key, 'transport_parameters_weight_in_grams' AS col_name, COUNT(DISTINCT tra

浏览 6提问于2016-09-05得票数 10

3回答

将PySpark连接到AWS红移时出错

、、、、

一直试图将我的EMR5.11.0集群上的Spark2.2.1连接到我们的Redshift商店。我遵循的方法是- 使用内置的Redshift JDBC /usr/share/aws/redshift/jdbc/RedshiftJDBC41.jar从pyspark.sql导入SQLContext sql_context = SQLContext( sc ) redshift_url = "jdbc:redshift://HOST:PORT/DATABASE?user=USER&password=PASSWORD“redshift_query = "select * f

浏览 3提问于2018-01-15得票数 4

1回答

ADF -如何将具有不同标题的多个CSV加载到一个目标表中

、、、

我有不同格式的CSV，在不同的时间通过SFTP进入。他们进来的时候需要处理。问题是:它们有相似的数据，但列名不同。我希望它们都在SQL数据库中的同一个目标表中。使用元驱动方法解决这一问题的最佳设计是什么？一条管道能做到这一点吗？示例： CVS 1格式1(标题) FirstName，LastName，电子邮件，Address1 CSV 2格式2(标题) LName，FName，EmailAddress 注两者都有不同的列标题名称。顺序也不同。一个有一个额外的列。两个CSV都需要导入到具有以下列的SQL表中：目标表 FirstName，LastName，EmailAddress 该解决方案似乎

浏览 1提问于2022-07-21得票数 1

1回答

如何在python中定义要写入AWS Redshift Postgres DB的数据的列类型

、、、

我有一个熊猫数据框，它看起来像这样： A B C D 80.00 2020-03-07 19:36:50 testing approved 80.00 2020-03-07 19:46:50 testing approved 我已经成功地将此pandas数据帧写入数据库，如下所示： conn = create_engine('postgresql://username:password@redshift-blablabla.eu-west-1.redshift.amazonaws.c

浏览 0提问于2020-03-13得票数 0

1回答

在SQLAlchemy中处理红移标识列

、、

我正在使用redshift-sqlalchemy包将SQLAlchemy连接到Redshift。在Redshift中，我有一个简单的"companies“表： create table if not exists companies ( id bigint identity primary key, name varchar(1024) not null ); 在SQLAlchemy端，我将其映射为： Base = declarative_base() class Company(Base): __tablename__ = 'companies'

浏览 1提问于2015-07-01得票数 17

2回答

如何在SQL SERVER中创建临时表？

、、

我正在尝试从另一个表(例如Redshift中)在Server中创建一个临时表，我执行以下操作 Create temporay table CARS as ( SELECT * FROM BD_CARS_111 ); SELECT * FROM CARS; SQL SERVER中是否有类似的语句？

浏览 11提问于2019-11-29得票数 1

1回答

要更新已修改表中的列的SQL

我是一个相当有能力的SQL程序员，但我的技能仍然是在简单插入、选择、更新语句方面，偶尔也有类似等。我目前想做的事情要复杂得多。这是一个场景。我有三张桌子。表1，*users*通过用户ID uid标识用户。用户可以拥有一个或多个子帐户。表2 *accounts*保存了每个用户的子帐户记录，其中包括列uid和sid，其中uid是在*users*表中定义的。表3，*data*目前正在将一些数据存储在与特定子帐户sid相关联的 data 列中。我刚刚意识到的是，没有特别的理由阻止用户跨子帐户使用这些数据。没问题-我可以将我的数据子集search SQL改为使用uid。

浏览 0提问于2013-06-07得票数 0

回答已采纳

3回答

AWS红移数据处理

、、、

我目前正在与一家小公司合作，该公司将他们所有的应用程序数据存储在AWS红移集群中。我的任务是对Redshift集群中的数据进行一些数据处理和机器学习。我需要完成的第一项任务是将集群中的现有数据转换为一些基于一些相当简单的SQL逻辑的新表。在MSSQL环境中，我只需将所有逻辑放入参数化存储过程中，并通过Server代理作业对其进行调度。然而，sprocs似乎并不是Redshift中的一件事。如何创建SQL作业并将其安排为在AWS环境中夜间运行(例如)？我的另一个任务是开发一个机器学习模型(用Python)，并在Redshift数据库中对记录进行评分。如果计划从Redshift集群中提取数据，

浏览 7提问于2017-10-07得票数 1

1回答

如何在循环中对输入DataFrame中的每条记录执行sql命令

、

如何在循环中对输入DataFrame中的每条记录执行sql命令我有一个具有以下模式的DataFrame %> input.printSchema root |-- _c0: string (nullable = true) |-- id: string (nullable = true) 我有另一个需要执行sql命令的DataFrame。 val testtable = testDf.registerTempTable("mytable") %>testDf.printSc

浏览 3提问于2016-05-17得票数 3

回答已采纳

1回答

按日拉取数据

、

我的红移集群中有数据，最好的方法是每天从红移中提取数据，并在几个sql查询的基础上在红移中创建一个新的表YY。例如，我们在redshift中有一个表XX，我想从表XX中拉出前10行，然后在redshift中创建一个表创建表格YY作为从XX中选择前10 *

浏览 2提问于2019-01-02得票数 1

1回答

需要根据表中的唯一值将一列分解为多列吗？

、、、

请帮助我在Excel和SQL/Redshift中使用合适的方法来完成这项工作。假设我有一个表，如下所示：我想将这列5分解成与该列中唯一值一样多的列，并将第6列的相应值放入行中。基本上，我只想要唯一的column1，column2，column3对的一行。所以，我想要的结果如下：

浏览 0提问于2018-09-04得票数 0

1回答

通过datapipeline将错误消息存储到Redshift

、、、、

我正在尝试通过数据管道在Redshift集群中运行SQL活动。在SQL活动之后，需要向红移中的表中写入一些日志，例如受影响的行数、错误消息(如果有的话)。要求:如果sql活动成功完成，则会将上述表中的“error”列写为null，否则，如果sql活动因任何错误而失败，则需要将该特定错误消息更新到Redshift表中的“error”列中。我们能通过管道实现这一点吗？如果是，我们如何做到这一点？谢谢，拉维。

浏览 2提问于2016-04-28得票数 0

1回答

如何在Redshift/SQL中解析从json字符串字段中检索值

、、

我有一排看起来是这样的： id = json_list \ expected_result "1“\ {"id":"1"，”1“，"text1”}，{"id":"3"，“文本”：“text3”}“text1” "2“{"id":"2"，”2“，”文本“："text2”}，{"id":"3"，“文本”：“text3”}“text2” 我想根据id列检索"text“字段。我如何在AWS红移中实现这一点？我知道Redshift有一

浏览 7提问于2020-07-30得票数 0

回答已采纳