Redshift TABLE从不停止执行_ffmpeg命令执行从不停止_PayPal IPN侦听器脚本从不停止执行 - 腾讯云开发者社区

python、amazon-web-services、amazon-s3、amazon-redshift

我正在尝试编写一个Python脚本来访问，以便在Redshift中创建一个表，并将数据从S3复制到Redshift表。我的代码是： import psycopg2 import os #import pandas as pd import requests requests.packages.urllib3.disable_warnings() redshift_endpoint = os.getenv("END-point") redshift_user = os.getenv("user") redshift_pass = os.getenv("

浏览 6提问于2017-10-07得票数 2

回答已采纳

1回答

DBLink查询即使在完成后也不会终止

postgresql、amazon-redshift、amazon-rds、dblink、datagrip

我有一个Dblink查询Amazon RDS (Postgres)，它使用Amazon Redshift集群中的行执行插入操作。查询在15/20分钟后终止，如果不是更长的话，但我可以看到所有行都在几分钟后被插入。我正在通过JetBrains的DataGrip运行这些查询。其他一些类似的dblink在相同的连接上，如预期的那样终止。我看到的唯一区别是表的大小，在第一种情况下更大。所有这些查询都只是复制整个表。就像这样： insert into rds_table( select * from db_link('foreign_server', $REDSHI

浏览 49提问于2019-10-17得票数 0

回答已采纳

1回答

如何将数据从AWS Aurora Postgres DB导出到Redshift？

postgresql、amazon-web-services、amazon-redshift、psycopg2、amazon-aurora

我有一个托管在AWS Aurora上的Postgres DB，需要从中检索数据并将其插入Redshift中。我目前的做法如下：使用上面创建的Psycopg2.With Aurora连接创建Aurora DB连接，查询Aurora DB表并将结果集作为CSV<code>E 219</code>文件导出到<code>E 120</code>S3<code>E 221<//code>使用OUTFILEFrom <code>E 125</code>S3</code>E 226</cod

浏览 5提问于2019-11-11得票数 0

回答已采纳

1回答

通过SQL客户端访问私有网络内的Redshift

database、amazon-web-services、amazon-redshift

我在私有网络内有一个Redshift集群，位于启动时创建的默认子网内，所有默认规则都是默认的。当我试图从SQL workbench连接到Redshift时，我意识到我必须添加一个入站规则，以允许来自我的IP的流量能够从我的笔记本电脑SQLWorkbench连接到Redshift。我的团队中的其他成员希望访问Redshift集群进行一般查询，我确信为每台笔记本电脑添加单独的规则不是让他们查询数据库的正确方式。我如何提供对它们的查询访问权限并管理一般的redshift访问权限？谢谢!

浏览 1提问于2019-12-06得票数 0

1回答

如何在AWS Glue PySpark中运行并行线程？

apache-spark、pyspark、aws-glue、aws-glue-spark

我有一个火花作业，它将从具有相同转换的多个表中提取数据。基本上是一个for循环，它遍历一个表列表，查询目录表，添加时间戳，然后插入Redshift (下面的例子)。这项工作大约需要30分钟才能完成。有没有一种方法可以在相同的星火/胶水环境下并行运行？如果我能避免的话，我不想制造单独的胶水工作。 import datetime import os from awsglue.transforms import * from awsglue.utils import getResolvedOptions from awsglue.dynamicframe import DynamicFrame f

浏览 4提问于2020-07-03得票数 5

回答已采纳

1回答

psycopg2.errors.FeatureNotSupported:红移表上不支持指定的类型或函数(每条信息消息一个)

amazon-redshift、airflow

我尝试从AWS Managed AirFlow获取对AWS RedShift的测试查询：查询： AWS_GET_DATA_FROM_REDSHIFT = """('SELECT * FROM information_schema.tables;')""" stage_data_from_redshift_to_s3 = FromRedshiftToS3TransferOperator( task_id=f'Stage_unload_{SCHEMA}_{TABLE}_from_redshift_to_s3_{S

浏览 172提问于2021-08-17得票数 0

回答已采纳

1回答

if-then-else逻辑可以在Redshift中完成吗？

sql、if-statement、amazon-redshift

我是RedShift的新手，但有使用MSSQL的经验。我想知道是否有任何方法可以用Redshift编写if-then-else逻辑基本上，我想在Redshift中运行这个逻辑 if ((select count(*) from a) - (select count(*) from b)) = 0 then drop table a; 提前感谢！

浏览 0提问于2014-07-10得票数 3

回答已采纳

2回答

如果更改用户的红移密码，该用户的任何预先存在的连接是否仍然有效？

passwords、credentials、amazon-redshift

假设我有一个Redshift用户'person1‘，密码是'oldpassword'，并且我有几个现有的打开的Redshift连接使用这些凭据。然后，我运行以下命令： alter user person1 password 'newpassword' 对于任何新的连接，我当然必须使用新的凭据'person1'和'newpassword'。但是，已经存在的连接是否仍然有效，或者在执行此命令后它们是否会突然停止工作？非常感谢!

浏览 0提问于2016-03-15得票数 6

1回答

为什么Amazon卸载性能对新数据要好得多呢？

amazon-web-services、amazon-redshift

我想知道为什么在按列选择时，从一个大表(>100个bln行)(即而不是--一个排序键或排序键的一部分)卸载，对于新添加的数据来说要快得多。Redshift是如何理解在第二个场景中是停止顺序扫描的时候了？执行查询的时间。39米37.02秒： UNLOAD ('SELECT * FROM production.some_table WHERE daytime BETWEEN \\'2017-01-15\\' AND \\'2017-01-16\\'') TO ... 与执行查询的时间。23.01次： UNLOAD ('SELECT

浏览 0提问于2017-06-26得票数 1

回答已采纳

2回答

使用复制命令将数据从亚马逊S3加载到红移-如何在红移中存储复制时间

amazon-web-services、amazon-s3、amazon-redshift

我正在使用Amazon Firehose流式传输在线数据，使用Lambda应用转换，并通过S3将数据加载到Redshift。Firehose中的COPY命令为： COPY <TABLE NAME> FROM 's3 Location' CREDENTIALS 'IAM ROLE' MANIFEST json 'auto' gzip; 我想知道Firehose制作S3到Redshift副本的确切时间，这样我就可以将其存储在Redshift中，并用于将来的参考。如何在执行复制命令时获得时间？示例:如果我有一个数据管道作业，我将获取sys

浏览 4提问于2017-07-18得票数 0

1回答

获取Redshift中的所有表名

aws-lambda、amazon-redshift

我正在尝试在Redshift数据库中获取所有的表。 import os import psycopg2 import sys import rds_config def lambda_handler(event, context): #for key in os.environ.keys(): # print(key) #return 0 REDSHIFT_DATABASE = rds_config.db_name REDSHIFT_USER = rds_config.db_username REDSHIFT_PASSWD = rds_config.db_pa

浏览 0提问于2018-12-24得票数 1

回答已采纳

2回答

将数据加载到Redshift后，Redshift表不会保留SAS排序顺序

sorting、sas、amazon-redshift、columnsorting

当我使用PROC SORT into Redshift加载按关键字(包含重复关键字)排序的SAS数据集时，Redshift中不会保留相同的排序顺序。例如。当我比较SAS数据集和Redshift表时，它们的排序顺序不同，数据在重复键中非常混乱，很难找到数据如何存储在Redshift列中的模式，或者为什么会发生这种情况。 ? ]1 任何关于在数据从SAS加载到Redshift后保持相同排序的建议或指导都将非常有帮助。谢谢！使用的代码： PROC APPEND BASE = Target_Table (bulkload=yes bl_compress=yes bl_bucket='x

浏览 36提问于2021-02-12得票数 0

回答已采纳

1回答

在Redshift查询中对架构和表名使用变量

amazon-redshift、query-variables

我希望能够使用Redshift中的变量名，它引用了我的DB对象(比如模式名和表名)。就像..。 SET my_schema="schema": SET my_table="table"; SELECT * from @my_schema.@my_table; 但看起来Redshift没有这样的功能。有什么解决办法可以做到这一点吗？

浏览 2提问于2022-10-19得票数 0

1回答

对火花和红移执行查询

apache-spark、amazon-redshift、data-warehouse

我们的数据仓库在Redshift (50 is大小)。有时，业务用户会运行大型查询(太多的联接、内联查询--由BI工具(如Tableau)生成)。大查询会降低数据库性能。明智的做法是使用红移顶部的星火来卸载红移之外的一些计算？或者，通过增加更多的节点来增加红移计算能力，会不会更容易、更有成本效益？如果我在星火中执行select a.col1, b.col2 from table1 a, table2 b where a.key = b.key。表通过JDBC连接，并驻留在Redshift上，实际处理在哪里进行(在Spark或Redshift中)？

浏览 6提问于2016-11-23得票数 2

1回答

停止Kinesis Firehose传送到redshift

amazon-web-services、amazon-s3、amazon-redshift、amazon-kinesis-firehose

我给s3和redshift发了个火龙带传送流。虽然我想继续将数据放到s3，但我想暂时停止向redshift发送数据。其中一个技巧是更改数据库表名。但这并不是很复杂，因为仍在发出请求。我想知道是否有其他方法可以停止向redshift发送数据。

浏览 11提问于2017-12-20得票数 0

回答已采纳

1回答

未登录的TypeError: DOMDocument::importNode()

php、mysql、domdocument

在本地运行php时会出现以下错误： Fri, 25 Mar 2022 03:11:55 +0000---Starting f_contracts with query 1 Fri, 25 Mar 2022 03:12:01 +0000---Starting XML -> JSON conversion Warning: XMLReader::expand(): /private/tmp/redshift-dump.xml:1109: parser error : Extra content at the end of the document in /Users/hm/repo/f_co

浏览 4提问于2022-03-25得票数 -1

1回答

当表存在时无法复制到不存在的表中

amazon-s3、amazon-redshift

因此，我有一个表nba_schedule，在下面创建。当我试图从s3 csv文件中复制数据以使用COPY插入到表中时，我会收到此错误InternalError_: Cannot COPY into nonexistent table newsletter_schedule。我认为这是因为这一切都发生在相同的交易中，这也是我在这里应该做的。此外，redshift变量位于env文件中，我不共享加载该文件的代码。 redshift_table = 'nba_schedule' # Connect to redshift conn_string = "dbname={}

浏览 10提问于2021-12-08得票数 0

回答已采纳

1回答

Python在没有任何S3桶文件类型的情况下从Redshift卸载数据。需要CSV文件格式

python、csv、amazon-s3、amazon-redshift

我有包含模式和表名的csv文件(格式共享在下面)。我的任务是以CSV文件类型将数据从Redshift卸载到S3桶。对于这个任务，我在下面的python脚本和我有2 IAM访问。第一，IAM访问从Redshift卸载数据。第二，访问将数据写入S3桶。我面临的问题是使用下面的脚本，我可以在我的S3桶中创建文件夹，但是S3桶中的文件类型是“-”，而不是CSV文件。我不知道可能的原因是什么？任何帮助都是非常感谢的。提前感谢您的时间和努力！注意:我有数百万行要从Redshift卸载到S3桶。包含模式和表名的CSV文件 Schema;tables mmy_schema;my_table Python

浏览 1提问于2022-04-13得票数 0

1回答

Redshift表中并发插入的问题

python、amazon-web-services、amazon-redshift、aws-glue、pg8000

我正在尝试使用AWS胶水上的python脚本同时处理红移数据库中的插入/更新。我使用pg8000库来执行所有的数据库操作。并发插入/更新失败，出现错误Error Name:1023 ,Error State:XX000)。在研究该错误时，我发现该错误与有关。有人可以查看代码并确保在进行插入/更新时不会发生冲突吗？我尝试在调用类中使用随机睡眠时间。它适用于几个案件，但后来随着工人人数的增加。它在插入/更新情况下失败。 import sys import time import concurrent.futures import pg8000 from

浏览 0提问于2019-07-18得票数 0

3回答

无效操作:关系information_schema.sequences不存在(SpringBoot + RedShift )

hibernate、spring-boot、spring-data-jpa、amazon-redshift、persistence

我正在尝试在我的Spring Boot应用程序中建立与Redshift数据库的连接。我的属性文件中有以下条目。 spring.datasource.driver-class-name=com.amazon.redshift.jdbc41.Driver spring.datasource.url=jdbc:redshift://redshift_url/db_name spring.datasource.username=username spring.datasource.password=password spring.datasource.testWhileIdle = true spr

浏览 155提问于2019-11-19得票数 0

1回答

后端数据库在速度上重要吗？

mongodb、cassandra、apache-spark

目前，我使用星火与卡桑德拉作为数据存储(我有一些NoSQL要求)。Spark有自己的内存处理框架，可以连接到各种数据库，如Cassandra、MongoDB、Redshift。因此，当通过Spark从这些数据库读取时，数据库的读性能(或写性能)重要吗？我想为了更快的读取而改变数据存储。

浏览 4提问于2015-09-16得票数 1

1回答

‘'freestyle’SQL执行

amazon-redshift

因此，在MSSQL中，我可以执行即席SQL语句。 if exists (select 1 from sys.databases where [name] = 'Admin') begin print('do something '); create schema lala; create table #temp(dummy nvarchar(128)); insert into #temp(dummy) values('lala'); end 在Redshift中，除了正式的功能或过程之外，我无法做任何类似的事情。

浏览 5提问于2022-05-05得票数 0

1回答

使用Python进行redshift mysql迁移

python、mysql、amazon-web-services、amazon-redshift

您好，我正在使用以下脚本将数据从mysql迁移到redshift。 mysql_table_name = 'clabDevelopment.KPI_kpireport' mysql_cur = mysql_conn.cursor() mysql_cur.execute('select * from %s where Date = "2018-01-01";' % mysql_table_name ) description = mysql_cur.description rows = mysql_cur.fetchall() # Insert

浏览 29提问于2018-06-29得票数 1

1回答

在redshift中指定数据库中的表

mysql、amazon-redshift

Redshift非常新，目前正在对Redshift进行微基准测试，与内部的旧数据库"MySQL“相比。在redshift中，我们可以在Redshift中指定数据库中的表吗？在MySQL中： CREATE DATABASE database_name; CREATE TABLE database_name.table_name (blah blah); SELECT * FROM database_name.table_name; 在Redshift中，它将失败： [Amazon](500310) Invalid operation: schema "database_n

浏览 1提问于2016-11-22得票数 0

1回答

红移。从S3上无效的JSON复制

amazon-redshift

我正在尝试将数据从S3上的JSON文件加载到Redshift中。但此文件包含格式错误-引号为“$”。 ${"id":1,"title":"title 1"}$ ${"id":2,"title":"title 2"}$ 从PostgreSQL导出数据时出错。现在，当我尝试将数据加载到Redshift中时，我会得到raw_line "$“的消息”无效值“。有没有办法使用Redshift复制命令转义这些符号，并避免数据重新上传或转换？我的命令 -- CREATE TABLE create

浏览 2提问于2020-12-22得票数 0

回答已采纳

1回答

如何在Redshift过程中写入动态创建的表

stored-procedures、amazon-redshift

我需要用Redshift编写一个将写入表的过程，但是表名来自输入字符串。然后，我声明一个变量，它将表名组合在一起。 CREATE OR REPLACE PROCEDURE my_schema.data_test(current "varchar") LANGUAGE plpgsql AS $$ declare new_table varchar(50) = 'new_tab' || '_' || current; BEGIN

浏览 5提问于2020-03-16得票数 0

回答已采纳

1回答

如何删除AWS红移服务器？

amazon-web-services

没有“停止”或“删除”群集的按钮。我成功地删除了默认的“工作组”，但Redshift仍然在运行。你知道如何从AWS网络控制台中删除Redshift Serverless集群吗？注意：无法使用AWS删除，因为它不在群集列表中 aws redshift describe-clusters { "Clusters": [] } 终于：在删除"Workgroup“和"Namespace”并等待几个小时之后，AWS Redshift Serverless就消失了。

浏览 0提问于2022-07-29得票数 1

回答已采纳

1回答

当方法参数不同时共享代码的最佳实践？

python、oop、inheritance

我有一个AWS Redshift包装类，它为我自动处理来自S3的类似类型的负载，最近我对它进行了调整，使其适用于不需要清单的Spark作业，而是需要一个稍微不同的COPY语句。除了这一种方法之外，所有其他代码都是可转换和可重用的。由于不同的方法参数，PyCharm给了我一个警告，我想知道是否有一种“最佳实践”的方法来做到这一点。 class RedshiftLoader(PrettyStr): def __init__(self, s3_credentials=config3.S3_INFO, redshift_db_

浏览 7提问于2016-07-12得票数 2

回答已采纳

2回答

如何删除与S3桶中特定模式匹配的文件？

python、amazon-web-services、amazon-s3、boto3、boto

我有一个S3桶，我保存CSV文件，以便将它们加载到Redshift中。为此，我使用了Python和Boto3。在将它们加载到Redshift中之后，我希望删除与包含我代码的处理ID的模式匹配的特定文件。我将我的文件保存到S3桶中，如下所示 Redshift{processingID}-table1.csv Redshift{processingID}-table2.csv Redshift{processingID}-table3.csv Redshift{processingID}-table4.csv 在处理包含特定ID的文件后，我希望从我的S3 bucket中删除已处理的文件。如何指定

浏览 3提问于2019-10-20得票数 1

3回答

Redshift:如何修复并发合并操作导致的可序列化隔离冲突(1023)？

aws-lambda、amazon-redshift

我的用例是从x个Lambda函数中以增量的方式实时提取、转换和加载数据。我希望多个Lambda函数能够并发运行，并且Redshift能够在读取查询时保持活动状态。由于Redshift不强制执行主键约束，因此我使用亚马逊网络服务文档Merge examples - Example of a merge that replaces existing rows来强制执行唯一行。当只有一个lambda函数实例在运行时，这个方法工作得很好。 -- Start a new transaction begin transaction; -- Delete any rows from SALES tha

浏览 75提问于2018-12-21得票数 1

1回答

当我的函数调用另一个函数时，没有定义'sqlContext‘

apache-spark、pyspark、apache-spark-sql、pyspark-dataframes

我有一个函数all_purch_spark()，它为五个不同的表设置Spark上下文和SQL上下文。然后，相同的函数成功地对AWS Redshift DB运行sql查询。它工作得很好。我在下面包含了整个函数(当然，去掉了敏感数据)。请原谅它的长度，但我想展示它，因为我面临的问题。我的问题是第二个函数repurch_prep()以及它调用第一个函数all_purch_spark()的方式。我想不出如何避免这样的错误: NameError:没有定义名称'sqlContext‘ 我将在下面显示这两个函数和错误。下面是第一个函数all_purch_spark()。我再一次将整个函数放在这

浏览 24提问于2020-08-19得票数 0

回答已采纳

1回答

Python/Pyspark迭代代码(用于AWS Glue ETL作业)

python-3.x、pyspark、aws-glue

我使用AWS Glue，如果不使用迭代，您就不能读写多个动态框架。我在下面编写了这段代码，但我在两件事上苦苦挣扎：是"tableName“，即筛选的表列表正确(我想从client_historical_*开始迭代的所有表)。在如何使用下面的映射动态填充Redshift表名方面陷入困境。红移映射： client_historical_ks --> table_01_a client_historical_kg --> table_01_b client_historical_kt --> table_01_c client_historical_kf -->

浏览 4提问于2020-05-28得票数 0

1回答

与select *复制的Amazon联接变量

sql、join、duplicates、amazon-redshift

我正试图在Redshift中创建一个新的表用来创建新表的代码可以自己工作，但当我将其包装在create中时，它就停止工作了无效操作:列名“号码”重复； create table test as (select a.* ,b.* from a inner join b on a.number = b.number ); 知道发生什么事了吗？我不想为省略b.numbe而指定b的每一列

浏览 1提问于2020-07-06得票数 1

回答已采纳

1回答

齐柏林的AWS红移驱动程序

jdbc、apache-spark、amazon-redshift、apache-zeppelin

我想探索我的数据红移使用笔记本齐柏林飞艇。一个小型的EMR集群正在后面运行。我正在加载databricks的星火红移库 %dep z.reset() z.load("com.databricks:spark-redshift_2.10:0.6.0") 然后 import org.apache.spark.sql.DataFrame val query = "..." val url = "..." val port=5439 val table = "..." val database = "..." val

浏览 9提问于2016-04-20得票数 2

回答已采纳

2回答

Java连接到

java、intellij-idea、jdbc、amazon-redshift、intellij-plugin

我正在尝试用我的Java代码连接到数据库。我在AWS网站上找到了一个应该能工作的代码片段。但是，我在实现JDBC驱动程序时遇到了问题。这是网站和网站代码： package connection; import java.sql.*; import java.util.Properties; public class Docs { //Redshift driver: "jdbc:redshift://x.y.us-west- 2.redshift.amazonaws.com:5439/dev"; //or "jdbc:postgresql://x.y.us-wes

浏览 0提问于2018-06-15得票数 0

回答已采纳

3回答

AWS Redshift IF-ELSE逻辑

sql、amazon-web-services、amazon-redshift

我基本上想在Redshift中做以下事情，但由于Redshift不支持过程语句，我不确定如何实现我的目标： IF EXISTS (select username,accountnumber from table where username={1}) THEN IF {0} NOT IN accountnumber update table set accountnumber = accountnumber+=',{0}' where username='{1}' END IF ELSE insert

浏览 82提问于2020-05-20得票数 0

1回答

如何使用alter table查询在AWS redshift中添加多列

sql、database、amazon-web-services、amazon-redshift

在Redshift中，是否可以在单个Alter查询中添加多个列 Alter table employee添加列名、添加列年龄、添加列Salary

浏览 57提问于2021-04-01得票数 1

回答已采纳

1回答

Redshift:在5分钟内自动从数据库中删除表

sql、amazon-redshift

我试图使用以下命令使用SQL工作台在redshift DB中创建表。 CREATE TABLE test_table (columnone varchar, columntwo varchar, columnthree varchar,columnfour varchar,columnfive varchar,columnsix varchar,columnseven varchar,columneight varchar); 成功地创建了它。我验证了表是从下面的行创建的。看到了表的存在，table_type是基表。 SELECT * FROM information_schema.ta

浏览 2提问于2018-01-23得票数 4

回答已采纳

2回答

Python将数据从Redshift加载到S3

python、pandas、amazon-s3、amazon-redshift

我正在尝试将一些红移查询结果加载到S3。到目前为止，我正在使用pandas_redshift，但是我被卡住了： import pandas_redshift as pr pr.connect_to_redshift( dbname = 'dbname', host = 'xxx.us-east- 1.redshift.amazonaws.com', port = 5439, user = 'xxx',

浏览 6提问于2017-10-30得票数 0

回答已采纳

1回答

Redshift:如何修复并发合并操作导致的可序列化隔离冲突(1023)？

redshift

我的用例是从x个Lambda函数中增量地、实时地提取、转换和加载数据。我预计多个Lambda函数将同时运行，Redshift将继续运行读取查询。由于Redshift不强制主键(S)约束，所以我使用aws文档合并示例-替换现有行的合并示例来强制执行唯一的行。当只有一个lambda函数实例运行时，此方法工作良好。 -- Start a new transaction begin transaction; -- Delete any rows from SALES that exist in STAGESALES, because they are updates -- The join inc

浏览 0提问于2018-12-20得票数 3

1回答

如何在Redshift中将系统表或信息架构表与用户定义的表连接起来

sql、amazon-redshift、information-schema、system-tables

我有一个要求，我需要连接红移Information schema表和User defined表。我已经尝试了下面的查询，并得到了提到的错误。 select * from pg_table_def a join user_defined_table b on 1 = 1 -- condition just to give an example where tablename = 'table1'; SQL Error [500310] [0A000]: [Amazon](500310) Invalid operation: Specified types or functio

浏览 66提问于2020-12-29得票数 0

1回答

在python中:子进程失效，而其他进程未死，不确定原因

python、parallel-processing、multiprocessing

编辑:答案是操作系统正在削减进程，因为我消耗了所有的内存。我生成了足够多的子进程，以保持核心负载平均为1:1，但是在一小时内的某个时刻，此脚本可能会运行数天，其中3个进程会： tipu 14804 0.0 0.0 328776 428 pts/1 Sl 00:20 0:00 python run.py tipu 14808 64.4 24.1 2163796 1848156 pts/1 Rl 00:20 44:41 python run.py tipu 14809 8.2 0.0 0 0 pts/1 Z 00:20

浏览 0提问于2013-03-21得票数 1

回答已采纳

1回答

在执行多个查询时，"psql -c“和"psql -f”有什么区别？

sql、amazon-redshift、psycopg2、psql、pyodbc

我正在尝试执行两个sql命令(创建一个新的模式和表)，如果执行失败，将启用两个命令的回滚。我连接到的数据库是AWS Redshift。 create schema if not exists test_schema; create table test_schema.test_table as select 1; 最初，我尝试使用python以编程方式执行这些命令，同时使用psycopg2和pyodbc，并得到以下错误： ERROR: schema "test_schema" does not exist 我意识到它失败是因为没有编写第一个命令，因此为了解决这个问题，我尝试打

浏览 0提问于2019-01-14得票数 4

1回答

用使用pytest调用的sql脚本测试cursor.execute

python、django、pytest

功能测试 def get_adgroups_not_taked_share( campaign_ids: List[str], src_table: str, spend_src_table: str ) -> List[Tuple[str, str]]: loses_adgroups: List[Tuple[str, str]] = [] with RedshiftCursor() as cursor: cursor.execute( """ SELET some_da

浏览 4提问于2022-08-02得票数 0

回答已采纳

1回答

亚马逊网络服务数据管道-如何从ShellCommandActivity设置全局管道变量

bash、amazon-web-services、amazon-data-pipeline

我正在尝试扩充我的管道(将数据从RDS迁移到RedShift)，以便它选择id大于RedShift中存在的最大id的所有行。我在Python中有一个脚本，它计算这个值并将其返回到输出。我想将此输出保存到一个变量max_id中，稍后可以在我的RDS选择查询中引用该变量。例如，我的RDS选择部分当前如下所示： { "database": { "ref": "rds_mysql" }, "scheduleType": "TIMESERIES", "name": "SrcRD

浏览 19提问于2016-09-02得票数 4

1回答

基于现有postgresql 1的Redshift Debezium连接器

amazon-redshift、apache-kafka-connect、debezium

我已经成功地使用插件卡夫卡连接。这个连接器直接连接到关系数据库的(WAL)，与普通的JDBC连接器相比，它大大提高了性能，后者通过sql查询不断轮询数据库。是否可以使用Redshift作为源，而不是Postgresql？我知道Redshift和Postgresql之间有很大的区别，因为Redshift是基于列的，基于集群的，没有辅助索引，而且它有不同的用例。如果Redshift与预写日志有任何相似之处，或者使用完全不同的方法，我就找不到确切的信息。是否有一种基于写前日志的方法来将数据从红移表直接通过debezium或其他方式从红移表流到kafka，或者在技术上是不可能的？如果没有，那么实现

浏览 5提问于2020-11-08得票数 0

回答已采纳

2回答

从PySpark批量加载到AWS RDS (postgres)

amazon-web-services、amazon-rds、aws-glue

我正在寻找一个胶水作业的批量加载器加载到RDS使用DataFormatWriter的PySpark脚本。我让它在RedShift上工作，如下所示： df.write \ .format("com.databricks.spark.redshift") \ .option("url", jdbcconf.get("url") + '/' + DATABASE + '?user=' + jdbcconf.get('user') + '&password=' + j

浏览 0提问于2018-09-07得票数 0

1回答

使用java程序从STDIN复制红移

postgresql、amazon-redshift

我有在Postgres上运行良好的Java程序，但是在迁移到Redshift时，我希望这个Postgres程序在Redshift上运行。在Postgres中，我使用了以下类，并试图在Redshift中使用相同的类。 import org.postgresql.copy.CopyIn; import org.postgresql.copy.CopyManager; import org.postgresql.core.BaseConnection; following is the program snapshot : Connection insertConnection = OpenDB

浏览 9提问于2015-07-24得票数 2

1回答

如何从lambda函数异步传递redshift查询？

python、postgresql、amazon-web-services、aws-lambda、amazon-redshift

我想在redshift中执行一组来自lambda函数的复制命令，在这个函数中，我将大约100 GB的文件从S3复制到redshift中的表中。为此，我不能使用Redshift Data API (因为我现在不能拥有集群的秘密arn，而且在我的情况下，获取临时凭据也不理想)。我尝试过使用psycopg2库，但是一旦lambda函数超时，执行也会停止。有没有什么方法可以异步地将查询传递给redshift，并且当lambda函数超时时，查询仍然在redshift中执行？

浏览 20提问于2020-12-03得票数 0

9回答