腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
将
json
解析
为
DynamicFrame
列
、
您好,我正在尝试
解析
json
文件在以下结构到
DynamicFrame
列
.我需要每一
列
分别 changedFields|First Name|Last Name| ...... | id
浏览 24
提问于2020-07-14
得票数 0
1
回答
胶水无法转换日期
、
从Glue
DynamicFrame
读取数据并将其写入RDS Postgresql实例时,Glue无法
将
格式
为
yyyy/MM/dd的日期转换为yyyy-MM-dd格式。该字段在Glue目录中被检测
为
类型字符串,数据库类型
为
date。设置日期格式
为
"yyyy-mm-dd“的字段。通过使用雅典娜查询编目的S3文件,我验证了源日期不为空。我尝试通过
将
DynamicFrame
转换为Spark数据框并转换
列
来<em
浏览 12
提问于2020-11-05
得票数 1
回答已采纳
5
回答
AWS Glue:如何处理具有不同模式的嵌套
JSON
、
、
、
目标:我们希望使用AWS数据目录
为
驻留在S3桶中的
JSON
数据创建一个表,然后通过Redshift频谱查询和
解析
该表。 背景:--
JSON
数据来自DynamoDB流,并且是深度嵌套的。理想情况下,我们希望使用Glue只
解析
第一个级别的
JSON
,并且基本上将较低级别作为大字符串对象(然后我们
将
根据需要使用Redshift谱
解析
这些对象)。目前,我们正在
将
整个记录加载到Redshift中的单个VARCHAR
列
中,但记录
浏览 0
提问于2018-03-23
得票数 23
回答已采纳
1
回答
如何在Scala中将DataFrame转换为
DynamicFrame
对象
、
、
我正在尝试
将
一些pySpark代码转换为Scala,以提高性能。在AWS (它使用Apache )中,会自动
为
您生成一个脚本,它通常使用
DynamicFrame
对象加载、转换和写入数据。但是,
DynamicFrame
类并不具有与DataFrame类相同的所有功能,有时您必须将其转换回DataFrame对象,反之亦然,以执行某些操作。下面是我如何在DataFrame中将
DynamicFrame
对象转换为pySpark对象: /
浏览 1
提问于2018-05-17
得票数 3
回答已采纳
1
回答
AWS胶DynamicFrames和下推谓词
、
、
我正在为AWS编写一个ETL脚本,该脚本来源于S3存储的
json
文件,其中我正在创建一个
DynamicFrame
,并试图使用pushDownPredicate逻辑来限制输入的数据: 我是AWS Glue和Spark的新手,尽管如此,对于为什么谓词时间戳不能针对实际上包含时间戳的分区
列
来
解析
,我感到
浏览 0
提问于2019-02-22
得票数 2
回答已采纳
1
回答
从array<string>中提取AWS胶
DynamicFrame
中的第一个值
、
、
我在S3中的
Json
结构如下。我已经成功地将它爬行到数据目录表中,并将其导入到
DynamicFrame
中。Value", "Value" "ColumnC": "Value",}我
浏览 1
提问于2020-04-15
得票数 2
回答已采纳
1
回答
AWS
将
Json
响应从GET(REST )请求转换为DataFrame/DyanamicFramce并存储在s3桶中
、
、
、
、
headersAPI = { , 'accept': 'application/
json
'skill_
json
=sk
浏览 0
提问于2021-07-27
得票数 0
1
回答
AWS Glue无法读取
JSON
Snappy文件
、
、
、
我在PySpark中读取AWS Glue作业的数据时遇到问题:火花遗物DataFramespark_df = spark.read.
json</
浏览 1
提问于2020-06-11
得票数 4
回答已采纳
4
回答
AWS Glue ETL和PySpark以及分区数据:如何从分区创建数据
、
、
、
我在一个S3桶中有一些数据,其中包含许多
json
文件,这些文件看起来有点像这样:day分区包含多个但是,我想根据每个文件的分区创建一个包含hour值的新
列
。我可以使用Spark创建一个带有常量的新
列
,但是如何使这个
列
使用分区作为源呢?df1 =
dynamicFrame
.toDF().withColumn("u
浏览 2
提问于2019-04-30
得票数 3
回答已采纳
1
回答
AWS胶-不知道如何
将
NullType保存为红移
、
、
、
当我运行胶水作业时,它会失败,例外情况是“不知道如何
将
NullType保存为REDSHIFT”。我不完全理解为什么,但我能收集到的最好结果是,
DynamicFrame
浏览 4
提问于2017-11-28
得票数 5
1
回答
在AWS胶中提供用户定义的列名
、
是否可以在胶水中
为
这些拼花文件提供我的列名?
浏览 1
提问于2018-09-20
得票数 1
2
回答
胶水作业模式推理问题
、
、
、
、
请求:我需要一个胶水作业
将
aws(嵌套结构-映射和列表的组合)数据导入s3。我的输入dataframe df0以struct格式包含
json
数据collection,因此我使用to_
json
将
struct转换为
json
-string在这里,我需要
json
字符串,而不是结构。 df1 = df0.select(to_
json</
浏览 3
提问于2020-08-24
得票数 0
回答已采纳
1
回答
AWS Python Glue作业没有
将
数字
列
导入RDS
、
、
、
、
正在导入字符串/varchar
列
,但不导入数字
列
。下面是postgres rds
列
类型:下面是python胶水脚本:
dynamicFrame
_dept_summary = self.glueContext.create_dynamic_frame.from_options], "
浏览 6
提问于2022-12-02
得票数 0
1
回答
AWS Glue -如何排除字符串不匹配日期格式的行
、
、
我有一个数据
列
的数据集。该
列
通常
为
'dd/MM/yy‘格式,但有时它有垃圾文本。我希望最终将
列
转换为日期,并将垃圾文本作为空值。 我一直试图使用resolveChoice,但是它导致了所有的空值。
浏览 0
提问于2019-05-23
得票数 0
2
回答
有没有一种方法可以在通过Glue插入到Redshift时简单地截断
列
?
、
、
我有一个比varchar(max)数据类型更大的
列
,据我所知,varchar(Max)数据类型是AWS Glue使用的最大数据类型,因此当我尝试加载我的表时,收到错误消息"String length exceeds我并不是要截断这一
列
,因为它并不那么重要,并且不知道如何在Glue中做到这一点。但是,我的老板坚持让我使用Glue来完成这项工作,所以我正在寻找一种使用Glue脚本截断
列
的方法。我查阅了很多文档,但找不到类似的东西。谢谢。请注意,varchar(65535)是一
列
在Redshift中可以包含的最大字符数
浏览 22
提问于2018-08-02
得票数 0
回答已采纳
1
回答
AWS胶排除模式
、
、
、
这是使用
将
数据从S3桶读取到
DynamicFrame
的方法,使用recurse连接选项设置
为
True,因为数据是大量嵌套的。我只希望读取以meta.
json
结尾的文件,因此我已经将设置
为
排除以data.csv "exclusions": ['**.Unable to parse file: <filename>.data.csv 是否可以
将
完整的S3 uri记录到输出日志,或者跟踪已经/尚未处理的文件?它仍然试图
解析
这
浏览 12
提问于2022-02-24
得票数 0
回答已采纳
1
回答
在AWS中,如何
将
resolveChoice应用于
DynamicFrame
中数组中的struct元素?
、
如何
将
resolveChoice应用于
DynamicFrame
中数组中的struct元素?用于参考的
DynamicFrame
模式|-- ColumnB: array| | |-- ColumnC| | |-- ColumnD: choice| | | |-- int 我想将resolveChoice应用于D
列
。
浏览 4
提问于2020-04-20
得票数 1
1
回答
用JDBC写AWS胶时PostreSQL Enum的问题
、
、
、
我正在尝试用JDBC写在一个AWSGlue数据库中编写一个
DynamicFrame
。目标表包含一个类型
为
Enum的
列
。首先从基础PySpark DataFrame中选择感兴趣的
列
,然后
将
DataFrame转换为
DynamicFrame
:final_df = df.select("id", "my_struct.*") # Convert back to
DynamicFrame<
浏览 3
提问于2021-12-09
得票数 0
1
回答
AWS Glue -无法在取消嵌套或关系后选择字段
、
、
、
在AWS S3中,我使用AWS的create_dynamic_frame.from_options("s3" ...)读取
json
文档,
DynamicFrame
.printSchema()向我展示了这一点() (已经尝试了这两种方法)
将
DynamicFrame
转换成一个新的dyF,然后.printSchema()向我展示了这一点,这似乎是不嵌套的:|-- updatedAt: string|--
json
.rowId: int 问题是,我似乎不能使用嵌套字段。dyF.sel
浏览 2
提问于2021-09-02
得票数 2
回答已采纳
1
回答
将
JSON
列
解析
为
、
、
、
我有这个数据: item = c("Box 1", "Tape", "Pen"),
json
= c("tape color"}', ) item length
json
, "color": &q
浏览 5
提问于2022-02-04
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
解析json数据,指定列去解析报错如何破?
微软Defender将Windows 11安装工具Flyby11列为潜在有害软件
批量汇总JSON文件数据?超级轻松!
数据加载、存储与文件格式
YOLOv5全面解析教程:将训练好的YOLOv5权重导为其它框架格式
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券