腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用于
无
名称
的
ArrayType
的
PySpark
from_json
架构
我正在尝试使用带有以下JSON字符串
的
from_json
,并且需要指定一个模式。什么模式与此JSON匹配?[{"key": "value1"}, {"key": "value2"}] 作为一种变通方法,我使用字符串连接将JSON转换为this (即添加数组
名称
)。但是,应该可以在不更改原始JSON
的
情况下指定模式。schema = StructType([ StructField("data",
ArrayTyp
浏览 9
提问于2019-02-02
得票数 1
1
回答
Databricks JSON列
、
在Databricks中,我有一列Json数据。我希望在每个记录中读取JSON数据,查找是否存在JSON列,如果存在,我希望更改值并在同一记录列中更新它。能帮个忙吗?JSON:
浏览 2
提问于2022-02-16
得票数 1
1
回答
没有来自eventhub
的
产出
、
、
、
我试着读取eventhub中
的
数据,但是结果是它只返回空值。df.toPandas()payload = dfSource_pandas.to_json(orient="records")这是数据
的
架构
import functions as FStringTypei
浏览 9
提问于2022-01-05
得票数 0
2
回答
如何在
ArrayType
中将字符串转换为字典(JSON)
、
、
尝试将StringType转换为JSON
的
ArrayType
,以获取从CSV生成
的
数据。
pyspark
在Spark2上
的
应用date,attribute2,count,attribute3来自printSchema()
的
片段 attribute3: string (nullable = true)
浏览 0
提问于2018-08-06
得票数 5
回答已采纳
1
回答
如何将字符串转换为火花放电中
的
数组?
、
、
、
我有一个包含一个列
的
table root我
的
问题是如何将该列转换为数组数组:T.
ArrayType
(T.
ArrayType
浏览 4
提问于2020-07-28
得票数 0
1
回答
将列表转换为
pyspark
中
的
dataframe列
我有一个dataframe,其中一个字符串类型列包含了一个项目列表,我想要爆炸,并使它成为父dataframe
的
一部分。我该怎么做呢?下面是创建示例dataframe
的
代码:from collections import OrderedDict | third|Jane|[{"name" : "click...|arg3列包含
浏览 3
提问于2019-10-21
得票数 3
回答已采纳
1
回答
解析在其中一个列中包含数组字符串
的
JSON字符串
Pyspark
列
、
、
、
、
这是json文件
的
内容。\",\"modifiedBy\":\"value24\"}","transactionId": "value25", "tableName": "X2"}]df = spark.read.json('path.json',multiLine=True) df = df.
浏览 0
提问于2019-06-01
得票数 0
回答已采纳
1
回答
将火花串列转换为vectorUDT
、
、
、
我用
的
是火药。 我需要把它转换成一个VectorUDT,将列作为机器学习算法
的
输入。
浏览 2
提问于2020-02-28
得票数 0
回答已采纳
1
回答
使用Spark DataFrames查询JSON数据列
、
、
、
我有一个具有以下结构
的
数据框架: |-- pk: string (nullable = true) |-- tags:string (nullable = true)+--------+---------+----------------------------------------------------------------------------------------------------------------------------+
浏览 4
提问于2021-04-13
得票数 0
回答已采纳
2
回答
Spark Structed Streaming从kafka读取嵌套
的
json并将其扁平化
、
一个json类型
的
数据: { "time_series": [ "time": "2020090300
浏览 81
提问于2020-09-04
得票数 1
回答已采纳
3
回答
如何在星火中解析字符串到数组?
、
、
inputDS.show(false) -----预期输出数据集outputDS-------"bar" |inputDS.select(explode(
from_json
(col("value"),
ArrayType
(StringType))))org.apache.spark.sql.
浏览 4
提问于2017-10-09
得票数 3
回答已采纳
1
回答
如何在
PySpark
中将列从字符串转换为数组
、
、
、
、
myp...| 1992| M| true|我需要从user列中提取一些元素,并且我尝试使用
pyspark
from
pyspark
.sql.functions import explode 当我尝试这样做时,会遇到以下错误,而不是所需
的
列表。import
pyspark
.sql.functions as f df2 =
浏览 1
提问于2022-02-09
得票数 1
回答已采纳
1
回答
Spark structured streaming with python
、
、
、
、
要求:我需要在Spark (执行转换)中处理来自Kafka ( JSON格式)
的
流数据,然后将其存储在数据库中。我有JSON格式
的
数据,比如{"a": 120.56, "b": 143.6865998138807, "name": "niks", "time": "2012-12-01 00:00:09"}data = spark.readStream.
浏览 1
提问于2017-04-08
得票数 1
3
回答
火花-将JSON数组对象转换为字符串数组
、
、
、
作为我
的
dataframe
的
一部分,其中一列以下列方式拥有数据 我想把它转换成字符串数组。
浏览 0
提问于2019-07-14
得票数 1
1
回答
如何从同时列出数据和模式JSON文件创建Spark-SQL数据帧
、
、
、
、
conf = SparkConf().setAppName("
PySpark
").setMaster("local")sqlContext|[[[index, integer...| +--------------------+--------------------+ 如何使用我自己创建
的
模式提取数据。我
的
模式代码是: from
pyspark
.sql.types import
ArrayType
, St
浏览 41
提问于2020-08-05
得票数 0
回答已采纳
1
回答
当写到火星雨中
的
拼板时忽略丢失
的
值
、
、
我需要转换一个拼花文件
的
内部结构。root -arrayroot -struct我为新结构定义了一个
架构
: [ Struct
浏览 0
提问于2018-04-02
得票数 1
回答已采纳
7
回答
Pyspark
:解析一列json字符串
、
、
、
我有一个由一个名为json
的
列组成
的
pyspark
,其中每一行都是一个json
的
unicode字符串。我想解析每一行并返回一个新
的
dataframe,其中每一行都是解析
的
json。.map(lambda x: json.loads(x))new_df = sql_context.createDataFrame(rdd, schema)但我得到
的
是同样
的
从
的
角度来看,用flatMap平平行在这里可能很
浏览 25
提问于2016-12-12
得票数 56
回答已采纳
2
回答
星星之火中
的
json列
的
合并和计数
、
、
、
)
的
大小。我试过: from
pyspark
.sql.types import StructType, StructFieldschema = StructType( StructField('a_id', StringType(), True) ) import
浏览 4
提问于2020-07-24
得票数 1
1
回答
PySpark
模式应该以DDL格式指定为字符串文字或schema_of_json函数
的
输出,而不是schemaofjson(`col1`);
、
我尝试通过schema_of_json函数从类似json
的
字符串中推断出一个模式,然后使用该模式通过
from_json
函数将该字符串值格式化为结构。我
的
代码是dfTemp = readFromEventHubs() df= dfTemp.withColumn("col1",string literal or output of the schema_of_json function instead of schemaofjson
浏览 0
提问于2019-12-04
得票数 2
1
回答
2个列表和/或1个二维数组
的
udf声明
、
、
、
我想声明一个返回2个1维数组或1个2维数组
的
udf (两个都是很好
的
例子)。我知道这适
用于
1D:然而,我已经尝试了许多变体,比如下面这些,但都没有成功:@udf("array<
浏览 4
提问于2019-01-30
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券