腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
Python
/
Spark
中
需要
反
错误
函数
的
代码
、
、
、
我知道一些库,比如scipy、symph和pyerf,它们提供了erfinv
函数
。然而,我正在寻找一个纯数学公式
的
代码
。
需要
替换此公式
中
的
erfinv (math.sqrt(2)* erfinv(x*2-1))
浏览 6
提问于2021-08-31
得票数 0
3
回答
为什么SparkSQL
在
SQL查询
中
需要
两个文本转义
反
斜杠?
、
、
当我从
Spark
2.0REPL(火花-shell)运行下面的Scala
代码
时,它会按我
的
意愿运行,用一个简单
的
正则表达式拆分字符串。我证实,我
的
一位同事为
Spark
1.5编写
的
一些非常类似的
代码
使用一个(字面上)
反
斜杠可以很好地工作。但是,如果我只
在
Spark
2.1
中
使用一个文字
反
斜杠,我就会从JVM
的
regex引擎"Dangling
浏览 10
提问于2017-01-20
得票数 7
回答已采纳
3
回答
如何在Pyspark中将行分成多行
、
、
我知道
在
Python
中
,人们可以使用
反
斜杠,甚至是圆括号来将行分成多行。 .set("
spark
.executor.memory", "10g") .set("
spark
.executor.
浏览 2
提问于2016-12-01
得票数 4
2
回答
SparkSQL正则表达式:无法从文本
中
移除
反
斜杠
我有数据嵌入
在
我
的
文本字段,我
需要
禁止。数据采用\ in格式,其中nnn为3位数。我原以为结果是“ABC\XYZ”,但我得到
的
结果是:|new_value|| ABCSXYZĮ|我不知道其他字符
在
C后面和Z不过,我也
需要
移除
反
斜杠。无论我如何试图逃避
反
斜杠,它失败了。我
在
regex101.com上测试了正则表达式,它很好。 我很感谢
的
任何建
浏览 10
提问于2022-10-13
得票数 0
回答已采纳
1
回答
在
自定义包
中
创建pyspark dataframe?
、
、
、
我对最佳实践以及如何在包
中
创建
spark
会话感到有点困惑,其中包可以
在
databricks或local上使用。但是假设我有一个
函数
,它接受一些数据列表或字典,预期
的
输出是包含数据
的
pyspark dataframe。我认为单个会话应该足够了,因此
需要
检查会话是否存在,如果不存在,则创建一个会话。但我只是不确定如何在
函数
中
做到这一点? 这是我
的
代码
,为什么它不在一个jupyter笔记本里面,我不知道这
浏览 2
提问于2020-10-31
得票数 0
2
回答
在
Spark
中
可以使用自定义
python
文件进行转换吗?
、
、
、
、
目前,我正在使用自定义映射器和缩减程序
在
hive
中
处理数据,如下所示:但是当我尝试
在
Spark
sql
中
应用相同
的
逻辑时,我得到了SparkSqlParser
错误
。我想重新使用process_data.py
中
的</em
浏览 0
提问于2019-08-27
得票数 0
1
回答
PySpark安全列类型转换
、
如果我将一个列强制转换为不同
的
类型,那么任何无法强制转换
的
数据都会被静默转换为NULL:+------++------+| null|+------+ 如果有任何值不能转换,有没有办法让转换产生
错误
浏览 4
提问于2017-09-29
得票数 0
2
回答
python
中
逆ERF
函数
的
命令
、
、
、
在
python
中计算
函数
的
反
错误
函数
(erf)
的
命令是什么,
需要
导入哪个模块?
浏览 0
提问于2015-07-07
得票数 13
3
回答
未找到Amazon EMR Pyspark模块
、
、
、
我创建了一个Amazon EMR集群,其中已经包含
Spark
。当我从终端运行pyspark时,当我ssh进入我
的
集群时,它进入pyspark终端。我使用scp上传了一个文件,当我尝试使用
python
FileName.py运行它时,我得到了一个导入
错误
:ImportError:
浏览 0
提问于2015-08-13
得票数 11
2
回答
但这在Glue
中
不起作用(但在EC2
中
起作用)
、
、
、
我
需要
获得一个
Python
Shell胶水作业一些数据库凭证存储
在
AWS Secrets Manager
中
。这应该很简单,但我工作
的
组织似乎有一个令人困惑
的
秘密经理角色,到目前为止,我还无法修改它来做我想做
的
事情。当我
在
EC2上测试时,我调用Lambda以获取返回glue
的
秘密
的
变通方法起作用了,但从Glue
中
,Lambda调用永远挂起。我确保我运行
的
角色拥有“Lambda完全访问
浏览 0
提问于2020-05-12
得票数 0
2
回答
忽略flake8检查带有
反
斜杠
的
代码
、
、
是否有一种方法可以忽略flake8检查\
代码
的
一部分?我不能在#noqa之后添加\。 .config('
spark
.driver.memory', os.getenv('
spark
_driver_memory')) \ .config('
spark
.executor.memory', os.getenv('
spark
_exe
浏览 2
提问于2018-08-06
得票数 2
回答已采纳
10
回答
使用pyspark创建
spark
数据帧时出现Py4J
错误
、
、
我已经
在
python
3.6
中
安装了pyspark,并且我正在使用jupyter notebook来初始化一个
spark
会话。from pyspark.sql import SparkSession,它运行时没有任何
错误
。但我写道,df.show() 它抛出
浏览 0
提问于2018-03-02
得票数 11
1
回答
与Scala相比,使用groupBy
的
Pyspark聚合非常慢。
、
、
、
我移植了一个Scala
代码
,它可以简单地聚合到
Python
中
:from utils import notHeader, parse, pprint17/01/25 16:22:10 INFO DAGScheduler: ResultStage 1 (colle
浏览 5
提问于2017-01-25
得票数 0
2
回答
错误
:找不到py4j,您
的
SPARK
_HOME可能无法正确配置
、
、
、
在
木星笔记本里,我无法跑到进口以下。findspark.init('home/ubuntu/
spark
-3.0.0-bin-hadoop3.2') ---------------------------------
SPARK
_HOME may not be configured correctlyexport
SPARK
_HOME=/
浏览 7
提问于2020-08-25
得票数 10
8
回答
设置了
SPARK
_HOME env变量,但朱庇特笔记本没有看到它。(窗户)
、
、
我
在
Windows 10上,我试图
在
Python
3.5
的
同时,
在
一个木星笔记本上启动并运行
Spark
。我安装了一个预构建版本
的
星火并设置了
SPARK
_HOME环境变量。我安装了findspark并运行
代码
:findspark.init() ValueError:找不到火花,确保
SPARK
_HOME env已经设置,或者
SPARK</e
浏览 5
提问于2016-07-16
得票数 8
回答已采纳
1
回答
创建pyspark
的
spark
context py4j java网关对象
、
、
、
为此,我
在
java进程
中
创建了一个数据帧(或行
的
数据集),并在Java端启动了一个py4j.GatewayServer服务器进程。然后,
在
Python
端,我创建了一个py4j.java_gateway.JavaGateway()客户机对象,并将其传递给pyspark
的
SparkContext构造
函数
,以便将其链接到已经启动
的
jvm
代码
的
命令:-
python
path_to_
python</
浏览 6
提问于2021-03-25
得票数 0
1
回答
如何将RDD从scala传递给
python
?
、
、
我试图将
Spark
从Scala传递给
Python
,这样我就可以从PySpark调用
函数
了。我
的
scala
代码
返回rdd.toJavaRDD(),然后我
在
python
中
通过以下方法阅读:这在一开始看起来是可行
的
,但是如果我在这个RDD上调用
函数
,比如
python
_rdd.count(),它将启动一个火花作业来获得结果,但是用
错误
:org.ap
浏览 1
提问于2022-01-29
得票数 1
1
回答
如何使用MySql使用
spark
.sql编写下行文?我正在尝试将字符串格式转换为日期格式。
、
我
需要
使用
python
在
Spark
.Sql
中
编写以下
代码
:产出栏:2021-02-01SELECT `Date` = CONVERT(DATE,`fr.M
浏览 21
提问于2022-03-29
得票数 0
回答已采纳
1
回答
我
的
SparkSession初始化要花费很长时间才能在我
的
笔记本上运行。有人知道为什么吗?
、
我
的
SparkSession要花费很长时间来初始化
spark
= (SparkSession .getOrCreate())等待了几个小时,但没有成功
浏览 1
提问于2019-01-14
得票数 3
1
回答
Databricks-Connect还返回多个
python
文件作业找不到
的
模块
、
、
目前,我正在通过databricks-connect与本地VS
代码
连接数据库。但是我
的
子任务都有模块未找到
的
错误
,这意味着其他
python
文件
中
的
代码
没有找到。我试过: 有人在这方面有经验
浏览 2
提问于2020-07-10
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
解决Python程序中错误代码0xC0000005的方法
在Python中如何在main函数中调用类中的方法
python yield在函数中起返回值中的使用
Starlight:帮助Python代码在Go中运行的工具
在Python中实现导入模块后直接调用函数的方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券