腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
json
中
的
嵌套
数据
创建
表
并
将其
追
加到
databricks
、
、
、
我正在生成一系列
嵌套
在
json
中
的
数据
,
并
希望将这些文件自动附
加到
databricks
中
的
一个
表
中
。我没有她
的
图式。这些
数据
将存储到azure存储
中
。# !OPTIONS (path 'dbfs:/mnt/lake/vsts/*.
json
浏览 22
提问于2020-02-18
得票数 1
1
回答
Azure
数据
工厂摄取
JSON
格式
、
、
我正在研究基于Cloud语言
的
ETL/ELT系统,这些系统可以处理深度
嵌套
的
JSON
/ XML文档。 我发现Azure Datafactory似乎符合我
的
要求。但是,文档让我不确定Datafactory是否可以处理这些深度
嵌套
的
文档。在我在这里找到
的
示例
中
:https://docs.microsoft.com/en-us/azure/data-factory
浏览 26
提问于2020-04-06
得票数 0
回答已采纳
1
回答
使用
Azure
数据
工厂从日志分析
表
中
读取
、
、
、
我们可以
使用
Azure
数据
工厂
中
的
哪个连接器连接到日志分析工作区?我
的
要求是读取"AzureActivity“
表
&
将其
写入存储帐户作为一个拼花文件。我想
使用
ADF从工作区
表
而不是活动日志直接读取
的
原因是,在工作区
中
运行
的
ETL进程已经解析了Activity文件,并且当我们从那里导出
表
时,
Json
输出没有那么原始和复杂。另外,如果
浏览 11
提问于2022-07-23
得票数 0
2
回答
AWS Glue
数据
目录作为外部服务(如
Databricks
)
的
元存储
、
、
、
、
比方说,
数据
服务器在AWS上。
使用
S3作为存储,Glue作为
数据
目录。因此,我们可以很容易地
使用
雅典娜,红移或电子病历查询
数据
在S3上
使用
胶作为亚稳态。我
的
问题是,是否有可能将Glue
数据
目录公开为外部服务
的
转移,比如托管在AWS上
的
Databricks
?
浏览 0
提问于2018-04-16
得票数 8
1
回答
事件中心
的
Azure
数据
库
、
、
、
我对
Databricks
非常陌生。所以请原谅我。这是我
的
要求 我怎么才能做这个活动。我想没有一个拍摄过程。我正计划
创建
一个笔记本
并
通过Azure Data运行它。将
数据<
浏览 1
提问于2018-11-14
得票数 4
回答已采纳
1
回答
Json
火花红移
、
、
、
我有一个有多个
嵌套
的
jsons
的
文件,我希望topush进行红移,我想首先可以将整个行保存为一个列字符串,然后保存。我对spark和scala都很陌生,所以请原谅我
的
无知,但是以
json
的
身份读取文件似乎会自动推断出一个模式,因为连接器im 不能为
嵌套
的
json
保存模式,所以我无法
将其
保存为redshift。因此,我
的
问题是,如何在具有
嵌套
json
的</e
浏览 3
提问于2016-07-11
得票数 1
回答已采纳
1
回答
如何通过terraform为Azure AD和
Databricks
配置SCIM配置?
、
、
、
、
TL;DR:是否有可能让terraform为Azure、AD和
Databricks
提供SCIM配置
的
Microsoft?我正在尝试为
Databricks
配置自动SCIM配置,以便用户和组管理可以通过Azure Active来完成,而不是在
Databricks
本身
中
完成。看起来,它可以通过企业应用程序或
使用
MicrosoftGraph来完成。 在编写本报告时,azuread提供程序上有,可以通过企业应用程序方法添加配置。我
使用
的
是azuread提供商<e
浏览 7
提问于2022-07-26
得票数 2
1
回答
如何
使用
服务主体
创建
Azure
数据
库集群
、
我有azure
databricks
工作区,我
使用
databricks
cli在工作区
中
添加了服务主体。我一直试图
使用
服务主体
创建
集群,但无法理解它。有什么能帮到我吗?我可以
使用
我
的
帐户
创建
集群,但我希望
使用
Service主体
创建
,
并
希望它是集群
的
所有者,而不是我。另外,是否有一种方法可以将群集
的
所有权转移到服务主体?
浏览 4
提问于2022-03-25
得票数 2
2
回答
如何在现有
数据
库之上
创建
具有只读访问权限
的
databricks
数据
库
、
我将用这张图片来想象我
的
问题:
Databricks
1在
Databricks
中
创建
数据
库(和
表
),并
将其
数据
存储在存储帐户
中
。在
Databricks
2
中
,我想读取
数据
:
Databricks
2只具有读取权限。我可以直接读取原始
的
增量文件,但是我想要
创建
一个
数据
库和
表
,它
浏览 2
提问于2020-04-10
得票数 2
回答已采纳
4
回答
Databricks
删除增量表?
、
如何在
Databricks
中
删除增量表?我在文档里找不到任何信息...也许唯一
的
解决方案是
使用
魔术命令或dbutils删除文件夹‘delta`
中
的
文件: %fs rm -r delta/mytable?编辑: 为了清楚起见,我在这里举了一个非常基本
的
例子。test_list = [['furniture', 1], ['games', 3]] df = spark.createDataFrame(test_list,s
浏览 93
提问于2019-11-22
得票数 8
回答已采纳
1
回答
将可扩展标记语言
数据
从Google Earth KML文件上传到
DataBricks
、
、
、
、
我正在设置
DataBricks
来比较和对比来自多个来源
的
数据
。有些
数据
是CSV文件,有些是
JSON
格式,还有一些是Google Earth KML文件。最后一个确实是一个挑战;我正在尝试
使用
数据
上传函数上传XML
数据
,但是
DataBricks
不能从XML字符串
创建
表
。将XML插入到
DataBricks
表
中
的
过程是什么?
浏览 37
提问于2019-04-18
得票数 1
1
回答
从Azure
Databricks
Notebook访问SQL Server
、
、
、
、
我正在
使用
Azure
Databricks
笔记本
并
访问Azure plateform上提供
的
SQL Server。val jdbc_url = sql-db-connection-stri
浏览 4
提问于2019-11-13
得票数 0
1
回答
数据
库
表
/模式部署
、
问题问题是 您通常如何部署
Databrick
浏览 3
提问于2020-05-11
得票数 1
回答已采纳
1
回答
数据
库
中
的
增量表和Power BI
中
的
增量表
、
、
、
、
我通过在
Databricks
中
挂载
并
创建
一个
表
(“
使用
增量”)来连接到Azure gen 2
数据
湖
中
的
增量表。然后我在Power BI中
使用
Databricks
连接器连接到它。首先,我不清楚
数据
湖和
Databricks
中
的
Spark
表
之间
的
关系。Spark
表
在每次查询时都会从
浏览 24
提问于2021-08-12
得票数 2
2
回答
Databricks
Delta和Hive事务
表
、
、
、
我从两个来源看到,现在你不能以任何有意义
的
方式与Spark
的
HIVE事务
表
进行交互。 我看到
Databricks
发布了一个名为
的
事务性功能。现在可以
使用
此功能读取配置单元事务性
表
吗?
浏览 0
提问于2018-12-13
得票数 2
2
回答
如何在
databricks
上安装jvmr包
、
、
我想在
databricks
上
的
scala脚本
中
调用R函数。我们有没有办法做到这一点呢?我
使用
scalac -cp "$JVMR_JAR"在我
的
mac上,它会自动打开一个可以调用R函数
的
scala。有没有办法在
databricks</e
浏览 1
提问于2015-07-22
得票数 0
1
回答
如何将
databricks
notebook
的
输出值作为字符串传递给
数据
工厂?
、
、
我有一个
databricks
notebook Notebook1,我在其中编写了一个查询,用于从
databricks
数据
表
获取last_mod_time,并
将其
保存为dataframe。现在,我已经在azure
数据
工厂
中
创建
了一个管道,
并
使用
该notebook
的
输出将last_mod_time值作为字符串传递给一个IF condition活动。
浏览 15
提问于2021-03-18
得票数 1
回答已采纳
1
回答
数据
库和Informatica湖连接器火花配置
、
、
、
我正在
使用
,
并
试图与
Databricks
集群建立连接。到目前为止,一切看起来都很好,但有一个问题是,在星火
的
配置下,我们必须为ADLS 2存储帐户放置SAS密钥。这样做
的
原因是,当Informatica试图写入
Databricks
时,它首先必须将该
数据
写入ADLS 2
中
的
一个文件夹
中
,然后
Databricks
实质上接受该文件并
将其
写入一个Delta
表
。现在,一个问
浏览 11
提问于2022-05-03
得票数 1
2
回答
Azure Data Google BigQuery复制
数据
活动不返回
嵌套
列名
、
、
、
、
我有一个复制活动在Azure
数据
工厂与谷歌BigQuery
的
来源。我需要导入整个
表
(其中包含
嵌套
字段-BigQuery
中
的
记录)。
嵌套
字段按如下方式导入(仅包含
数据
值
的
字符串): "{\"v\":{\"f\":[{\"v\":\"1\"},{\"v\":\"1\"},{\"v\":\&q
浏览 4
提问于2021-09-15
得票数 2
回答已采纳
1
回答
小数点(10,0)到十进制(38,18)转换无效
的
Databricks
Delta
表
Alter列
、
、
、
在
Databricks
中
,
表
是
使用
模式
json
定义
创建
的
。用来
创建
表
的
架构
json
"fields": [ "metadata": {}, "nullable":我正在
使用
readstre
浏览 0
提问于2021-10-17
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【Python基础】Python字典嵌套:编程界的俄罗斯套娃
使用Azure Cosmos DB和DocumentDB包进行快速ASP.NET核心开发
局域网监控软件中的SQL代码优化策略
HarmonyOS4.0 ArkUI常用组件
手把手教你用Rust搭建REST API
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券