RDS etl 数据库_RDS etl 数据_RDS etl 数据仓库 - 腾讯云开发者社区

amazon-web-services、etl、aws-glue

我是AWS的新手。我想使用AWS glue进行ETL过程。我们是否可以使用AWS glue来分析RDS数据库，并使用ETL作业将分析的数据存储到rds mysql表中谢谢

浏览 26提问于2019-12-24得票数 1

2回答

如何编写ETL作业以将mysql数据库表传输到另一个mysql rds数据库

amazon-web-services、etl、aws-glue

我是AWS的新手。我想使用AWS Glue编写ETL脚本，将数据从一个mysql数据库传输到另一个RDS mysql数据库。请建议我如何使用AWS glue完成这项工作谢谢

浏览 0提问于2020-01-02得票数 0

1回答

无法在amazon上为postgres创建架构

postgresql、amazon-rds、pgadmin

我正试图在位于Amazon上的postgres实例上创建一个模式。该架构将用于从构建在本地db上的现有架构导入数据。问题是我没有在RDS上创建架构的权限。我用来连接到postgres实例的用户dw_etl具有角色rds_superuser，它类似于superuser角色。dw_etl应该能够创建新的模式。问题：有办法用RDS创建模式吗？如果我不能在RDS上创建模式，那么“竖井”数据的最佳方法是什么？public模式会变成某种转储吗？谢谢

浏览 0提问于2017-06-13得票数 1

回答已采纳

1回答

对RDS使用Sequelize获取TimeoutError: ResourceRequest超时

node.js、sequelize.js、amazon-rds

我有一个使用将数据加载到amazon RDS PostgreSQL实例中的node.js ETL系统。突然之间，我开始在向数据库中插入记录时看到随机的超时错误： TimeoutError: ResourceRequest timed out at ResourceRequest._fireTimeout (/home/ubuntu/myproject/etl/node_modules/generic-pool/lib/ResourceRequest.js:62:17) at Timeout.bound (/home/ubuntu/myproject/etl/node_modul

浏览 112提问于2019-10-25得票数 2

1回答

AWS胶水在顺序运行时输出空文件

amazon-web-services、etl、aws-glue

我正在尝试自动化ETL管道，将数据从AWS RDS MYSQL输出到AWS S3。我目前正在使用AWS Glue来完成这项工作。当我执行从RDS到S3的初始加载时。它捕获文件中的所有数据，这正是我想要的。但是，当我向MYSQL数据库添加新数据并再次运行Glue作业时。我得到一个空文件，而不是添加的行。任何帮助都将不胜感激。

浏览 16提问于2021-02-11得票数 1

1回答

创建AWS Postgres RDS模式的一致视图？

postgresql、amazon-web-services、amazon-rds

我有一个AWS RDS postgres从另一个RDS实例中读取副本。我希望对特定模式中的所有表有一个一致的视图，这样我就可以查询它们以达到ETL的目的。我试图做的类似于pg_dump，但我更希望得到模式的一致视图并查询表，而不是将它们写到单独的文件中。现在我们正在使用生产数据库的快照，恢复它们并从那里流，但是保存快照需要很长时间，因为从快照数据库加载和读取的性能非常差。

浏览 1提问于2016-06-06得票数 0

回答已采纳

3回答

从亚马逊网络服务DataLake到远程数据服务

amazon-web-services、amazon-s3、etl、amazon-rds、data-lake

我对DataLakes比较陌生，我正在为一个亚马逊网络服务项目做一些研究。我已经创建了一个DataLake，并从胶水爬虫中生成了表，我可以在S3中查看数据并使用雅典娜进行查询。到目前一切尚好。需要将存储在datalake中的部分数据转换为RDS，以便应用程序读取数据。从S3 DataLake到RDS的ETL的最佳解决方案是什么？我见过的大多数帖子都谈到了从RDS到S3的ETL，而不是反过来。

浏览 6提问于2019-11-08得票数 1

1回答

将数据从Kinesis (或s3)传输到RDS postgres chron作业

postgresql、amazon-web-services、amazon-s3、amazon-kinesis、amazon-kinesis-firehose

我对AWS非常陌生，我正试图找到一种方法，将数据从Kinesis流可靠地传输到AWS RDS postgres数据库表。在进入的过程中，记录需要进行小的转换，比如过滤器(不是所有的记录都会被插入，取决于一个键)，并被解析为插入到postgres。目前，来自动态流的数据正被消防水管作为地板用消防软管倾倒到S3桶中。我有点迷失在很多可能的方法中，比如： ->消防软管-> Lambda -> RDS -> -> S3 ->数据管道ETL作业-> RDS S3 -> RDS的数据库迁移？ AWS胶水？其他.？在一个没有服

浏览 1提问于2018-10-17得票数 5

回答已采纳

2回答

使用AWS Glue从S3 -> RDS移动数据

amazon-web-services、amazon-s3、amazon-rds、aws-glue

AWS Glue是否提供将数据从S3存储桶移动到RDS数据库的能力？我正在尝试设置无服务器应用程序，它可以拾取上传到S3的动态数据，并将其迁移到关系数据库。 Glue提供了爬虫服务来确定模式。 Glue还提供了ETL Job，但目标源似乎只是另一个S3存储桶。有什么想法吗？

浏览 35提问于2019-03-11得票数 4

1回答

RDS Postgres to Kinesis数据流，用于通过AWS glue实时加载数据

postgresql、amazon-web-services、amazon-kinesis

要求是实时地将数据从RDS POSTGRES加载到RDS oracle。 AWS Glue是ETL工具。AWS Glue具有实时从Kinesis获取数据以进行流式传输的功能。我正在努力将Postgres的数据带到Kinesis。有什么建议吗？

浏览 0提问于2021-01-19得票数 0

1回答

是否可以设置从多个其他RDS主实例进行复制的RDS实例？

mysql、amazon-web-services、amazon-rds

假设我有三个RDS实例A、B、C，每个实例上都有一个模式。我喜欢创建一个A.b模式，它是实例B上主模式的复制从模式，然后是一个A.c模式，它是实例C上主模式的复制从模式。这在RDS中是可行的吗？实际情况是，我的应用程序数据库是A上的主实例，然后我在实例B和C上还有另外两种类型的应用程序。在ETL到数据仓库的过程中，我需要连接这三个表中的一些表。虽然我现在不在RDS/MySQL上，但我真的很喜欢。但我不知道我是否能做我上面说过的事情。

浏览 11提问于2019-01-21得票数 0

2回答

如何自动化ETL作业的部署和运行？

automation、amazon-redshift、etl、data-warehouse、aws-glue

我们有ETL作业，即java jar(执行etl操作)是通过shell脚本运行的。根据正在运行的作业，使用一些参数传递shell脚本。这些shell脚本可以通过crontab运行，也可以根据需要手动运行。在shell脚本运行之前，有时还需要在posgresql RDS DB上运行一些sql命令/脚本。我们在亚马逊网络服务上拥有一切，即Ec2 talend服务器，Postgresql RDS，Redshift，ansible等。我们如何自动化这个过程？如何部署和处理传递自定义参数等。欢迎使用指针。

浏览 5提问于2018-06-28得票数 2

1回答

星火如何处理与时间相关的JDBC数据？

apache-spark、jdbc、pyspark、apache-spark-sql

我正试图通过每天的ETL作业将S3上的Spark数据库与旧的Oracle数据库同步。我正试图理解，当Spark连接到像Oracle这样的RDS以获取数据时，它会做什么。它是否只获取在斯帕克向数据库提出请求时(即，如果它在2/2 17:00:00从Oracle DB获取数据时，它只会抓取到那个时间点的数据)？本质上说，任何新的数据或更新在2/2 17:00:01将不会从数据获取？

浏览 5提问于2017-02-03得票数 1

回答已采纳

1回答

AWS RDS -让我访问BI/DW系统的最佳方式是什么

azure、amazon-web-services、amazon-rds

我们已经与一家公司合作，从我们的事务系统(AWS RDS Sql Server)为我们构建一个BI/数据仓库解决方案。通过VPC和安全组授予我们数据库的只读访问权限的最佳方式是什么，这些VPC和安全组提供了最佳的安全配置文件，同时仍然保持良好的连接性能，以使ETL作业能够运行？请注意，BI端正在Azure中运行。

浏览 14提问于2017-01-27得票数 0

回答已采纳

1回答

AWS胶回滚策略

amazon-web-services

我正在做从甲骨文RDS到s3的ETL。如果我正在运行我的ETL脚本，它正在将一些数据转储到s3中，并且中断了一些东西，我如何回滚我的整个脚本呢？是否有任何回滚策略或配置aws胶提供？

浏览 1提问于2017-11-29得票数 0

2回答

从AWS RDS到Azure SQL数据仓库的数据迁移

azure、amazon-web-services、migration、etl、data-migration

我的应用程序数据库在AWS RDS (postgresql)中运行。我需要将数据从AWS迁移到Azure SQL数据仓库。这是一种ETL过程，我需要对Postgresql中的数据进行一些计算/计算/聚合，并将其放入Azure SQL数据仓库中的不同模式中，以便进行报告。此外，我需要定期同步数据，而不是重复。我是数据迁移概念的新手，请告诉我实现此任务的最佳可能方法是什么？谢谢！

浏览 1提问于2017-04-25得票数 0

2回答

将Postgres RDS模式复制到Redshift

amazon-web-services、amazon-s3、amazon-redshift

我是RedShift的新手。下面的是我的流程在S3中创建my数据库(Postgres)表的CSV副本。使用连接到redshift的sql中的"create“在RedShift中创建一些暂存表(用于ETL目的)。使用Copy命令将数据从S3移动到RedShift。问题：我的暂存表(它将在ETL进程之后与其他暂存表一起删除)与RDS中的源表具有相同的模式。但是每次我构建一个新的暂存表时，我都必须编写一个长的"create“命令，而当我拥有一个具有100多个功能的表时，它就会变得令人沮丧。有什么简单的方法来复制架构吗？还是我需要用我目前的流程来改变一些事

浏览 4提问于2016-06-06得票数 0

回答已采纳

2回答

数据仓库的AWS红移或RDS？

amazon-web-services、amazon-redshift、amazon-rds、data-warehouse

现在，我们有一个从API中提取信息的ETL，在OLTP数据库中的一个大表中进行转换和存储，我们希望将这个表迁移到一些OLAP解决方案中。读取此表只是为了执行我们存储在OLTP数据库中的一些计算。哪种服务最适合这里？我们目前正在评估Redshift，但以前从未使用过该服务。此外，我们还想到了RDS中的一些雪花模式(某种带有维度的事实表)，因为它的目的是存储10‘t到100’t，但不知道这种方法可以扩展多少。

浏览 4提问于2021-07-22得票数 0

回答已采纳

2回答

Redshift中的增量加载

amazon-web-services、amazon-s3、amazon-redshift、amazon-data-pipeline、attunity

我们目前正在将数据加载到Redshift中。我们这里有不同的场景。如果OLTP数据库是驻留在本地的SQL Server，那么我们可以考虑像Attunity这样的工具，它可以帮助通过S3将数据加载到Redshift。Attunity在CDC中是智能的，它可以识别读取事务日志的更改，并可以相应地将更改应用到目标。但这种工具在ETL过程中应用转换逻辑的能力较差。Attunity不是SSIS或ODI的替代品，但可以很好地从各种来源提取和加载数据。因此，为了进行转换，我们需要一个合适的ETL工具。我们可以使用Attunity在Redshift中的登台区域加载数据，并且可以从登台区域使用其他ETL工具或触

浏览 8提问于2014-12-14得票数 0

2回答

如何将数据从一个AWS帐户的RDS移动到另一个帐户

postgresql、amazon-web-services、etl、amazon-rds、data-migration

我们有我们的web服务和数据库建立在AWS上一段时间以前，应用程序现在正在生产。出于某种原因，我们需要终止旧的AWS，并将所有内容移到新创建的AWS帐户下。应用程序和所有的基础设施都非常简单。不过，对于数据来说，这是更棘手的问题。目前的数据库每天仍收到大量数据。因此，在关闭旧应用程序并在新平台上切换之后，最好迁移数据。源RDS和目标RDS都是Postgres。我们有大约40 to的数据要传输。我可以想到三种方法，它们都有缺点。拍摄第一个RDS的快照，并在第二个RDS中还原它。问题是我不需要将所有的数据从源传输到目的地。也许10/01之后的记录就足够了。另外，快照在刚刚创建的空rds中进

浏览 0提问于2018-11-13得票数 4

1回答

如何在数据加载之前截断AWS Glue作业中的RDS表？

amazon-web-services、etl、aws-glue

我使用AWS Glue作为ETL将数据加载到RDS表中，这是一个每日快照表，需要在当天的数据加载之前截断。我在DynamicFrameWriter类中尝试了"Preactions“参数，但它看起来只是红移。参考：

浏览 17提问于2019-07-17得票数 1

2回答

mysql根据值将一列划分为多列

mysql、sql

mysql> select description from devices where id=172; +--------------------------------------------------------------------------------+ | description | +-----------------------------------------------------------------------------

浏览 0提问于2012-06-07得票数 0

回答已采纳

1回答

在AWS RDS上连接到免费试用postgres的故障排除

postgresql、connection、psycopg2、pgadmin-4

这是一个临时数据库，所以我不介意共享凭据。我们已经在RDS中设置了以下内容：主机和端口与确认公共访问 DB名称没有显示用户名和密码，但是我100%肯定我们正在将正确的用户名和密码输入到PgAdmin 4和python的psycopg2.connect函数中。在PgAdmin 4中的失败连接但是，我们无法在PgAdmin 4和python中进行连接。数据库绝对是公开的，我相当肯定我们正在输入正确的参数。我认为dbname是testdb而不是实例ID etl-test 有什么问题吗？我不确定的是VPC和VPC安全小组.我们是否需要将这些输入到python或Pg

浏览 9提问于2021-11-09得票数 0

回答已采纳

2回答

为什么我的AWS Glue爬虫不创建任何表？

amazon-web-services、aws-glue

我正在尝试使用AWS来ETL，这是RDS到S3中的一个S3数据库，这样我就可以使用SageMaker或雅典娜这样的服务中的数据。此时，我不关心转换，这是一个原型，我只是想将DB转储到S3，以开始测试各种工具链。我已经建立了一个Glue数据库并成功地测试了到RDS的连接我使用AWS提供Glue IAM服务角色我的S3桶有正确的前缀aws-glue-* 我使用Glue数据库、AWSGlue服务角色和上面提供的选项( )创建了一个爬虫。数据存储区中的架构更新:更新数据目录中的表定义在数据存储区中删除对象:从数据目录中删除表和分区。当我运行爬虫时

浏览 0提问于2019-01-10得票数 2

1回答

是否可以借助阿里巴巴快速BI对存储在MariaDB中的数据进行实时分析？

mysql、cloud、mariadb、alibaba-cloud

我想借助Quick BI实时分析存储在MariaDB中的数据，是否可以将MariaDB与QuickBI连接？我也发现ETL不支持Quick BI。此外，到目前为止还没有对MariaDB的RDS支持，我能够在路线图中找到它。有没有人能给我提个建议？

浏览 1提问于2018-09-26得票数 0

2回答

当AWS glue ETL作业中的glueContext.write_dynamic_frame.from_jdbc_conf返回错误时会发生什么？

amazon-web-services、etl、aws-glue、aws-glue-data-catalog

假设我已经对s3存储桶中的文件进行了编目，但由于主键冲突或其他原因导致在RDS中插入记录时发生错误，我的ETL作业会停止处理吗？我如何知道发生了错误？如果需要，我如何重新处理这些记录？我如何知道处理了哪些文件的数据？

浏览 26提问于2020-05-17得票数 0

1回答

亚马逊网络服务胶水ETL作业中的Boto3胶水

python-3.x、pyspark、aws-glue、aws-glue-data-catalog

我正在运行AWS Glue ETL job ( PySpark )，在那里我已经创建了Glue的boto3客户端来启动爬虫程序并执行一些其他的PySpark处理。问题是胶水作业在start_crawler被调用后继续运行。它既不会给出任何错误，也不会结束或启动爬行器。我的代码片段如下： import sys import boto3 import time glue_client = boto3.client('glue', region_name = 'us-east-1') crawler_name = 'test_crawler'

浏览 23提问于2021-08-09得票数 0

1回答

创建Aurora集群的每日临时克隆

mysql、amazon-web-services、amazon-aurora

我想创建一个Aurora MySQL集群的临时克隆来运行日常ETL(以确保它不会影响其他服务)，然后在ETL完成后终止它。 import boto3 client = boto3.client('rds') old_cluster_identifier = 'test-etl' new_cluster_identifier = 'test-etl-clone' response = client.restore_db_cluster_to_point_in_time( DBClusterIdentifier=new_cluster

浏览 20提问于2020-04-22得票数 0

回答已采纳

1回答

如何处理Redshift中缓慢变化的维度类型2？

postgresql、amazon-redshift

我想超时跟踪用户名的变化。我在Redshift中有以下用户表： id username valid_from valid_to current -------------------------------------------------------- 1 joe1 2015-01-01 2015-01-15 No 1 joe2 2015-01-15 NULL Yes 我的源数据来自RDS Postgres。我正在考虑如何处理这个问题的几个选择： 1)创建use

浏览 3提问于2015-12-16得票数 7

1回答

跨多个SQL数据库并行执行SSIS (ETL)

sql、performance、ssis

我有多租户数据库(每个客户一个DB )。目前，我们已经将SQL内存设置为60 %的RAM，并一次在一个站点上运行ETL。是否可以同时跨多个站点/数据库运行ETL？注:在ETL执行过程中，由于ETL使用最大RAM，其他操作将很慢，因此想知道两个ETL能否在不同的数据库中在相同的位置运行。

浏览 8提问于2022-03-17得票数 0

1回答

Boto3 rds- Aurora不支持数据continueAfterTimeout？

amazon-web-services、amazon-aurora、aws-rds-data-service

我正在尝试使用AWS rds-数据api在极光服务器级Postgresql中执行一些繁重的etl操作。根据文档，By default, a call times out if it's not finished processing within 45 seconds. However, you can continue running a SQL statement if the call times out by using the continueAfterTimeout parameter. 我看到支持continueAfterTimeout参数(一个布尔值)。我可以在这样的

浏览 14提问于2020-12-14得票数 1

回答已采纳

1回答

启用WAL的SQLite数据库在读取时阻塞用户

linux、database、sqlite、file-permissions、user-permissions

以下是背景：我目前正在linux服务器(CentOS 8)上运行ETL进程，该服务器还承载从本地SQLite数据库读取的应用程序。当ETL运行并写入SQLite数据库时，应用程序也会从数据库中读取。为了避免应用程序使用SQLite数据库时的数据库锁定，我在SQLite数据库上启用了WAL，以便在应用程序使用时，ETL可以写入数据库。但是，现在存在以下问题:在建立连接后，ETL进程无法查询数据库。发生这种情况时，我记录了以下信息： “shiny套装”用户运行ETL进程。“闪亮”用户运行应用程序。根据管理员的说法，这些用户属于同一组。来自/etc/组的输出首先，我不明

浏览 1提问于2021-12-31得票数 0

1回答

代理作业:在不同的服务器上执行T？

sql-server、etl、ssis-2016

在更新的硬件/软件上迁移Server数据库时，我们将ETL服务器与数据库服务器(引用此链接)分开。我们在ETL服务器上移动SSIS包和代理作业。但是代理作业中的T步骤也需要数据库出现在同一台服务器上。如何从这里开始，在ETL服务器上创建数据库，还是只在ETL服务器上移动SSIS包，并将代理作业保留在数据库服务器上？

浏览 0提问于2020-03-03得票数 0

1回答

AWS Glue ETL作业缺少集合名称

mongodb、etl、aws-glue

我有由爬虫生成的数据目录表，一个是mongodb的数据源，另一个是数据源Postgres (rds)。爬行器成功运行，连接测试正常工作。我试图从mongodb到postgres (简单转换)定义一个ETL作业。在作业中，我将源定义为AWS Glue Data Catalog (mongodb)，目标定义为数据目录Postgres。当我运行作业时，我会得到以下错误： IllegalArgumentException:缺少集合名称。通过“spark.mongodb.input.uri”或“spark.mongodb.input.collection”属性设置看起来这与mongodb部分有关。我试

浏览 6提问于2022-05-25得票数 0

1回答

AWS Glue PCI是否符合？

amazon-web-services、pci-dss

我是PCI世界的新手，但我的团队需要研究ETL (提取-转换-加载)解决方案，以便将数据从一个地方转移到另一个地方。我查看了亚马逊的符合PCI DSS标准的资源列表，发现Glue不在那里。这是否意味着在需要符合PCI的情况下不应该使用Glue？还是不需要因为它没有存储数据，只是将数据转换并加载到RDS数据存储中？

浏览 0提问于2018-11-07得票数 3

回答已采纳

1回答

DBT:为dev/stage/prod环境服务的相同代码

informatica、dbt

我试图用相同的代码来设置DBT，用于开发/阶段/产品环境，我们的dev数据库类似于EDW_TEL_ETL_DB _TEL_ETL_DB_DV1/EDW_TEL_ETL_DB_DV3，而stage/qa数据库类似于EDW_TEL_ETL_DB_TS1/EDW_TEL_ETL_DB_ as _3，为了实现这个目的，我有如下sources.yml： sources: - name: EDW_TEL_ETL_DB_SS database: | {%- if target.name == "dev1" -%} EDW_TEL_ETL_DB{{ env_

浏览 8提问于2022-05-15得票数 0

2回答

使用Django Delete删除对象

python、django、amazon-web-services、django-models

我在仅从数据库中删除单个对象时遇到问题，我有一个代码，该代码从AWS获取RDS主机名列表，然后将存储在我的数据库中的rds主机名与AWS返回的rds主机名进行比较，如果RDS主机名存储在我的数据库中且未由AWS返回，则应将其从我的数据库中删除，但我的代码最终会删除存储在我的数据库中的所有RDS主机名这是我的模型 class AwsAssets(BaseModel): aws_access_token = models.CharField(max_length=512, blank=True, null=True) aws_secret_token = models.CharF

浏览 0提问于2020-04-15得票数 0

1回答

将数据从s3加载到极光-大文件

database、amazon-s3、amazon-rds、amazon-aurora

我目前正在使用athena处理和执行ETL -从其中我获得了csv文件，其中包含要加载到aurora rds表中的整个数据集。我发现从S3加载数据是加载数据的一种选择。因为这些文件非常大，大约有10 GB，有4-500万行数据。极光能否处理来自同一文件的如此巨大的数据负载，或者在此过程中是否会有超时。如果有必要，如何才能使这些过程更有效？

浏览 49提问于2019-03-11得票数 0

1回答

在excel表格中添加新行时，如何通过Azure数据工厂更新mysql数据库？

azure、azure-data-factory、azure-data-factory-2

我的sharepoint中有这个excel表格。因此，我连接到我的excel工作表，然后执行一些ETL。这些数据被传递到mysql数据库。现在，假设我在我的excel表中添加了新行。如何告诉Azure数据工厂仅对新行执行ETL并将其添加到我的mysql数据库中。因此，我不想再次对所有行运行ETL流程，而是只对新行运行ETL流程。

浏览 1提问于2021-05-30得票数 0

1回答

从Lambda访问RDS

amazon-web-services、aws-lambda、amazon-rds、amazon-vpc、aws-security-group

RDS数据库详细信息：我有一个可公开访问的RDS数据库，该数据库仅限于访问特定的IP地址。 RDS有两个安全小组附属于RDS：第一安全组允许特定的IP地址访问它。第二安全组允许多个特定的IP地址访问它。注意:我知道我只需要为这个目的保留一个安全小组。这个RDS数据库具有默认的VPC和3个公共子网。所有这些子网在路由表中都有两条路线： localDestination：目标:默认范围和目标： 0.0.0.0/0和目标: internet网关 Lambda函数详细信息：我有一个lambda函数，它没有配置任何vpc。我正在尝试从lambda函数中的代码访问RDS数据库。因为lambda

浏览 6提问于2021-10-02得票数 0

回答已采纳

1回答

如何在使用AWS Glue时查找更新的行？

amazon-web-services、pyspark、etl、aws-glue

我正在尝试对从RDS迁移到Redshift的数据使用Glue for ETL。据我所知，胶水书签只查找使用指定主键的新行，而不跟踪更新的行。但是，我正在处理的数据往往有频繁更新的行，我正在寻找可能的解决方案。我对pyspark还是个新手，所以如果可以在pyspark中做到这一点，我将非常感谢一些指导或正确方向的观点。如果在Spark之外还有可能的解决方案，我也很乐意听到。

浏览 13提问于2019-01-26得票数 4

回答已采纳

1回答

Neo4j ETL组件数据库-支持

neo4j

在伦敦的Graph connect 2017上，我听到了Praveena Fernandes在将关系数据库迁移到GraphDatabase方面对NEO4J ETL组件工具箱的恐惧。在演讲中，她提到该工具支持DB2和Oracel关系数据库等。当我下载etl时，我只能找到对MySQL和PostgreSQL的支持有人知道ETL支持DB2和Oracel数据库吗？致敬//Andreas

浏览 1提问于2017-05-29得票数 0

6回答

IOPS还是吞吐量？-在Amazon实例中确定写入瓶颈

mysql、amazon-web-services、amazon-rds

我们每晚都会向运行在Amazon中的Mysql报告数据库加载几十万条记录的作业。负载作业需要几个小时才能完成，但我很难弄清楚瓶颈在哪里。该实例目前正在使用通用(SSD)存储运行。通过查看cloudwatch指标，我似乎在过去一周平均不到50 IOPS。然而，网络接收吞吐量小于0.2MB/秒。如果我被网络延迟(我们目前正在从远程server...this加载数据，最终会改变)或写入IOPS，那么是否可以从这些数据中判断？如果IOPS是瓶颈，我可以轻松地升级到提供的IOPS。但是，如果网络延迟是问题所在，我将需要重新设计负载作业，以从EC2实例加载原始数据，而不是远程服务器，这将需要一些时

浏览 0提问于2015-02-18得票数 14

3回答

什么算ETL？

database、etl、crm

我知道ETL代表提取、转换和将数据加载到一个新的目标数据库中。但它在什么范围内仍然可以算作ETL？例如，如果我想将一个有7000条记录的联系人数据库移动到CRM软件中，这个过程也算ETL吗？

浏览 2提问于2018-04-23得票数 2

回答已采纳

1回答

即使Fivetran连接器保持同步，RDS Postgres最古老的复制滞后也会在不活动期间增加。

postgresql、replication、amazon-rds、postgresql-13

我正在建立一个使用Fivetran作为ETL层的数据仓库。源数据库之一是AWS RDS Postgres实例。我已经将Postgres实例配置为使用test_decoding插件执行WAL的逻辑复制。所有这些在办公时间似乎都正常工作，但是在没有预先设置查询的办公时间之外，尽管Fivetran连接器执行同步，最古老的复制时隙滞后大小仍在增加。你可以在下面的图片中看到这个。在红色方框中，复制时隙滞后的大小正在增加(顶部图)，而同步时刻则每小时发生一次(下图)。如果复制时隙的滞后大小在同步时刻附近减小，我会期望一个类似于绿色框中的图形。 📷 我就这个问题联系了Fivetran，但是他们还没有发现

浏览 0提问于2021-07-28得票数 3

回答已采纳

2回答

如何将一个RDS实例的snaphsot复制到另一个实例？

amazon-rds、snapshot

我们正在创建新的RDS实例，并启用了加密选项。一旦创建了新的RDS实例，我们就需要拥有与旧实例相同的数据。我们有关于所有RDS实例的每日快照。有没有办法将这个RDS快照复制到新创建的RDS实例中？对我来说，一个选择是对旧RDS实例中的每个数据库进行mysqldump，并将其添加到新RDS实例中的各个数据库。这很费时，因为每个数据库快照都达到40-50 GB。如果有什么简单的方法复制快照并将其放到新的RDS上，请告诉我。

浏览 2提问于2015-10-14得票数 1

1回答

用PowerShell和AWS加载数据本地信息

mysql、powershell、amazon-web-services

在过去的两天里，我一直在搜索googles，试图了解我是否能做到这一点。我有一个托管在aws上的MySQL实例，我需要每小时加载一个小的CSV文件。LOAD数据本地INFILE似乎是一张票，但我似乎找不到任何地方向我展示如何将它从我的机器上用powershell发送到AWS MySQL实例。有人能帮我处理代码吗，或者至少给我举几个例子？我可能就快到了，我终于找到了一段视频： [void][System.Reflection.Assembly]::LoadWithPartialName("MySql.Data") $csvPath = 'D:/ETL_Data/Twit

浏览 2提问于2017-04-08得票数 1

回答已采纳

1回答

忽略AWS弹性豆柄RDS_DB_NAME环境变量(Rails 5)

ruby-on-rails、postgresql、environment-variables、amazon-rds、amazon-elastic-beanstalk

我一直在使用ebdb数据库，这是ElasticBean秸秆在RDS中创建的。看来，弹性豆柄控制台中的RDS_DB_NAME环境变量可以保留为空白，而不会影响应用程序的功能：我重新启动了App (使用EB控制台)，没有任何效果。我注意到，当我进入RDS时，数据库名仍然奇怪地被列为ebdb。有人能证实这种行为吗?如果我是对的，我如何在RDS上交换到另一个数据库呢？(在我的例子中，我正在测试备份和还原，并希望我的Rails 5.2应用程序可以暂时指向恢复的数据库。) FWIW，我有标准的Rails配置/database.yml： production: <<:

浏览 0提问于2018-09-27得票数 1

1回答

可以在AWS RDS中动态创建数据库吗？

php、mysql、amazon-web-services、amazon-ec2、amazon-rds

我正在尝试创建一个新的数据库，这样我就可以将我的应用程序转移到AWS，而不用做太多的工作。根据这个，我应该这样做来连接到一个RDS数据库： $link = mysqli_connect($_SERVER['RDS_HOSTNAME'], $_SERVER['RDS_USERNAME'], $_SERVER['RDS_PASSWORD'], $_SERVER['RDS_DB_NAME'], $_SERVER['RDS_PORT']); 它可以工作，所以我尝试添加一个新的数据库，并使用新的数据库创建了一个新的连接+查询

浏览 0提问于2015-09-14得票数 0

2回答

如何从AmazonS3导入postgresql数据库(.sql)文件到AWS RDS？

python-3.x、postgresql、amazon-s3、amazon-rds、aws-glue

如何从AmazonS3导入postgresql数据库(.sql)文件到AWS RDS？我对AWS和Postgresql非常陌生。我已经使用PgAdmin4创建了一个数据库，并将我的数据添加到数据库中。我已经创建了我的数据库的备份文件，即.SQL文件。我已经在AWS RDS上创建了一个数据库实例。我已经上传了我的数据库文件和几个文档s3存储桶。我尝试使用AWS S3集成AWS Glue和RDS数据库，但都不适用于我。我不知道如何集成S3和RDS来将数据从S3导入和导出到RDS，反之亦然。您能告诉我如何设置RDS和S3吗？

浏览 4提问于2021-02-14得票数 0