腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Spark
在
IDE
中
创建
数据
帧
(
使用
databricks-connect
)
、
、
、
、
我正在尝试
使用
databrick connect
在
IDE
中
运行我的databricks笔记本
中
的一些代码。我似乎想不出如何
创建
一个简单的
数据
帧
。
使用
: import
spark
.implicits._ var Table_Count = Seq((cdpos_df.count(),I_count,D_count,U_count)).toDF(尝试从头开始
创建
数据
帧</em
浏览 69
提问于2021-09-14
得票数 0
1
回答
为什么Databricks连接测试不能在Mac上工作?
、
、
我已经阅读了配置
databricks-connect
的文档,但是在运行
databricks-connect
test时仍然会遇到下面的错误java.lang.NoSuchMethodErrorcorrect result <e
浏览 0
提问于2019-07-22
得票数 4
1
回答
在
启用进程隔离的集群
中
还不支持Databricks Connect
、
、
、
、
我正在
使用
Azure (6.5运行时),并试图将其连接到
IDE
。但是,为了
在
集群
中
启用AAD凭据传递,我们需要将以下属性设置为true
spark
.databricks.pyspark.enableProcessIsolationtrue 但这会导致
databricks-connect
测试因错误而失败。
浏览 3
提问于2020-10-12
得票数 0
2
回答
数据
库-连接测试: TypeError:预期的str、字节或os.PathLike对象,而不是NoneType
、
我正在从本地机器设置databricks,而在所有配置之后,我收到了
databricks-connect
test的错误 追溯(最近一次调用):文件"c:\programdata\anaconda3\lib\runpy.py",第193行,
在
_run_module_as_main "main“
中
,mod_spec)文件"c:\programdata\anaconda3\lib\runpy.py",第85行,
在
_run_code exec(代码,run_globals)文件第
浏览 2
提问于2020-01-24
得票数 2
1
回答
使用
java.lang.OutOfMemoryError()和databricks连接时运行到‘toPandas:Java堆空间’
、
、
、
、
我正在尝试将一个大小为2734984行x11列的pyspark转换为一个名为toPandas()的熊猫
数据
。
使用
时,它完全可以正常工作(11秒),但当我
使用
databricks-connect
运行完全相同的代码(db-connect版本和Databricks运行时版本匹配,两者都是7.1)时,我会遇到java.lang.OutOfMemoryError我认为这个错误
在
databricks-connect
中
的某个地方,因为我不能
使用
笔记本复制它。 有什么
浏览 20
提问于2020-12-09
得票数 7
回答已采纳
1
回答
有没有办法通过.NET for Apache
Spark
查询Databricks、DBFS或parquets?
、
、
、
、
简而言之,我正在尝试探索从Databricks工作区向C#/.NET应用程序提供
数据
以进行用户交互和即席查询的可能性。我花了一些时间来设置
Databricks-Connect
,就我可以从本地机器运行Databricks集群上的Python
Spark
作业而言,它似乎是有效的。我还尝试遍历设置并执行来自.NET for Apache
Spark
的示例 我的问题是,我很难找到任何涉及这两者协同工作的文档、示例或演示。有没有可能在.NET
中
建立一个
spark
会话,允许针对databr
浏览 32
提问于2021-05-07
得票数 1
回答已采纳
3
回答
在
带有databricks的工作区之间切换.连接
、
是否可以
使用
databricks-connect
来切换工作区?我目前正在尝试切换:
spark
.conf.set('
spark
.driver.host', cluster_config['host']) 但这会返回以下错误:AnalysisException: Cannotmodify the value of a
Spark
config:
spark
.driver.host
浏览 17
提问于2022-03-23
得票数 1
回答已采纳
1
回答
在
databricks-connect
中
可以有多个连接吗?
、
、
我已经
在
我的PC上设置了一个miniconda python环境,在那里我安装了
databricks-connect
包,并
使用
databricks-connect
configure配置了该工具,以连接到我想在美国开发代码时
使用
的我需要连接到另一个不同的databricks实例,以便在欧盟开发代码,我想我可以通过设置一个不同的miniconda环境,
在
该环境
中
安装
databricks-connect
,并将该环境
中
的配置设置为指向新的当
浏览 19
提问于2021-03-13
得票数 1
2
回答
在
Databricks中导入笔记本
、
、
、
我正在
使用
databricks-connect
和VS Code为Databricks开发一些python代码。我想
使用
databricks-connect
直接从VS code
中
编码和运行/测试所有东西,以避免与Databricks web
IDE
打交道。对于基本的笔记本,它工作得很好,但我想对多个笔记本做同样的事情,并
使用
导入(例如,
在
另一个笔记本中
使用
import config-notebook )。然而,
在</e
浏览 45
提问于2021-10-19
得票数 1
2
回答
Databricks Connect:无法连接到azure上的远程群集,命令:'
databricks-connect
test‘停止
、
、
、
、
我尝试将Databricks Connect设置为能够
使用
已在Azure上的Workspace上运行的远程Databricks Cluster。当我尝试运行命令'
databricks-connect
test‘时,它永远不会结束。 我关注官方documentation。 我
在
3.7版本
中
安装了最新的Anaconda。我已经
创建
了本地环境: conda create --name dbconnect python=3.5 我已经
在
5.1版本
中
安装了'
浏览 68
提问于2019-05-31
得票数 4
1
回答
无法
在
Azure DataBricks集群上执行scala代码
、
、
、
、
我正在尝试为DataBricks设置一个开发环境,这样我的开发人员就可以
使用
VSCODE (或其他一些
IDE
)编写代码,并在DataBricks集群上执行代码。因此,我查看了的文档,并按照文档
中
的建议进行了设置。发布我能够
在
Azure DataBricks集群上执行python代码的设置,但不能
使用
Scala代码在运行安装程序时,我发现它说的是跳过上的scala命令测试,我不确定这里是否缺少一些配置
浏览 2
提问于2020-08-26
得票数 1
1
回答
如何在本地
使用
databricks-connect
执行火花代码?
、
、
、
是否有方法
在
本地
使用
执行火花代码? 原因是我希望执行一些测试,作为CI/CD管道的一部分,而不需要启动和运行集群。
浏览 0
提问于2019-07-24
得票数 6
回答已采纳
1
回答
Sparklyr未连接到
数据
库
、
、
、
、
我正在尝试
使用
sparklyr或SparkR连接到
数据
库。install.packages("sparklyr") sprk <-
spark
_connect(master = "local") # this code works perfectly and it conn
浏览 0
提问于2018-11-27
得票数 1
4
回答
如何在pyspark中加载databricks包dbutils
、
File "<stdin>", line 1, in <module>那么,有没有办法通过包含databricks包来
在
pyspark
中
运行它,就像导入一样?
浏览 13
提问于2018-08-17
得票数 7
1
回答
databricks-connect
,py4j.protocol.Py4JJavaError:调用o342.cache时出错
、
与
数据
库的连接工作正常,与DataFrames的工作也很顺利(连接、过滤等操作)。当我在
数据
帧
上调用cache时,问题出现了。at java.io.ObjectInputStream.readNonProxyDesc(ObjectInputStream.java:1857)我根据需要
使用
在
python-jvm桥接层上,这看起来像是一个本地问题,但java版本(8)和python (3.7)是必需的。切换到java13会产生完全相同的消息。版本
databricks-
浏览 0
提问于2020-02-04
得票数 1
2
回答
检查databricks
中
是否存在路径上的delta表
、
、
在
加载之前,我需要删除三角洲湖表
中
的某些
数据
。如果存在
数据
,我可以从delta表
中
删除
数据
,但当该表不存在时,它会失败。
数据
库下面的scala代码val del_ID = "Check_ID =" + "123" val deltaTable
浏览 2
提问于2020-10-06
得票数 5
回答已采纳
1
回答
从本地计算机连接到Databricks时出错
、
、
、
我做了一个pip install -U
databricks-connect
==5.5.*原因: com.databricks.service.SparkServiceConnectionExceptionhttps://docs.databricks.com/api/latest/authentication.html#generate-a-token - Ge
浏览 30
提问于2020-03-04
得票数 3
4
回答
为什么
在
配置Databricks连接之后"
databricks-connect
“不能工作?
、
、
、
我想
使用
IntelliJ IDEA直接在集群
中
运行我的
Spark
进程,所以我将按照下一个文档 配置完所有这些之后,我运行
databricks-connect
test,但是没有像文档所说的那样获得Scala
浏览 2
提问于2019-05-02
得票数 4
回答已采纳
3
回答
数据
库连接& PyCharm &远程SSH连接
、
、
、
我设置了映射 我
创建
了一个conda环境,方法是
在
vm
中
启动一个终端,然后下载并连接到
databricks-connect
。我
在
终端上测试它,它运行良好。我
在
py魅力配置上设置了控制台。但是,当我尝试运行
spark
会话(
spark
= SparkSession.builder.getOrCreate())时,
databricks-connect
搜索.databricks-连接文件
中
的错误文件夹Please
浏览 1
提问于2020-07-10
得票数 2
2
回答
数据
库
中
定义的功能的单元测试和火花放电DF的单元测试
、
、
、
、
我定义了一些函数,并在其他笔记本
中
调用它,我想
创建
一个笔记本,它在ADF
中
对所有这些功能进行单元测试,还需要进行单元测试,比如源文件和
数据
帧
之间的计数匹配。 如何做到这一点?
浏览 5
提问于2022-07-18
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
怎样使用CAD在nVisual中创建楼层场景
在 Obsidian 中创建和使用链接 | Linux 中国
干货分享:在NASTRAN中创建和使用外部超单元
浅谈Hadoop在大数据中的作用以及与Spark的关系
使用 Python在Mattermost 中创建 ChatOps 聊天机器人|Linux 中国
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券