腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Pyspark-
使用
python
或
pyspark
转换
excel
文件
的
行
和
列
、
、
、
我有一些
文件
(Xlsx),其中包含代理名称及其数据等数据,然后是代理名称及其数据。 示例: ? ? ? 如何添加一个
列
,该
列
将包含所有包含其数据
的
列
中
的
代理名称?
浏览 31
提问于2021-09-14
得票数 0
1
回答
PySpark
安全
列
类型
转换
、
如果我将一个列强制
转换
为不同
的
类型,那么任何无法强制
转换
的
数据都会被静默
转换
为NULL:+------++------+| null|+-----
浏览 4
提问于2017-09-29
得票数 0
1
回答
运行spark.read.json时在json中找到重复列,即使没有重复列
、
、
、
在
PySpark
和
Synapse数据流中,我遇到了非常奇怪
的
错误。 我正在
使用
下面的查询读取JSON
文件
,但得到重复
的
列
错误,即使没有重复
的
列
。我可以
使用
其他工具
和
JSON验证器来读取它,也可以
使用
数据流,但不能在
PySpark
中读取。"/opt/spark/
python
/lib/<em
浏览 3
提问于2021-11-25
得票数 0
1
回答
Spark XML -
使用
Excel
中
的
XML
、
、
、
我有一个
Excel
表,其中一
列
包含xml(每一
行
都是一个不同
的
xml)。我正在尝试
使用
Pyspark
和
spark-xml通过执行df = spark.read.format('xml').options(rowTag = 'book').load(___)来解析这些内容。当您指定一个xml
文件
时,load工作得很好,但是是否可以读取
Excel
表格并循环这些要解析
的
xml,而不必
浏览 17
提问于2020-06-15
得票数 2
1
回答
无法在putty中
的
Cron作业中运行
python
文件
、
、
我
使用
的
是Putty,它没有
Python
3,它有
python
2
或
python
,所以尝试
使用
命令来运行
python
文件
。55 08 * * * /usr/bin/
python
2 /home/user/file.py 还有几条其他命令,但什么也没起作用。我所拥有的
python
文件
运行得非常好,可以
使用
闪烁2
浏览 4
提问于2022-07-24
得票数 1
1
回答
如何在
excel
和
csv
文件
中自动跳过
行
,直到在
python
中找到标题行为止?
、
、
我们是否可以
使用
python
(任何模块)使代码跳过不必要
的
行
,直到在
excel
和
csv
文件
中找到标题
行
?在上面的示例中,我们需要自动跳过前3
行
,然后从第4
行
开始读取
文件
,从"G/L“开始,这是文档
的
主要标题
行
。
浏览 17
提问于2022-09-14
得票数 0
回答已采纳
1
回答
无法将RDD
转换
为DataFrame (RDD有数百万行)
、
、
、
我正在
使用
ApacheSpark1.6.2但是,我必须首先将它
转换
为RDD来进行映射,以获得我想要
的
数据(
列
)。"c:\spark\
python
\lib\
pyspark
.zip\
pyspark
\rdd.py", line 1297, in take File "c:\spark\
python
\lib\<e
浏览 3
提问于2017-01-14
得票数 4
回答已采纳
2
回答
将
Excel
数据写入Server数据库
的
脚本
、
、
、
、
我需要某种起点来完成以下任务:现在,我不知道我应该/可以
使用
什么样
的
脚本语言来执行这个任务。希望你能给我指明正确
的</
浏览 5
提问于2012-07-26
得票数 0
2
回答
如何正确循环
和
构建
pyspark
dataframe
、
、
、
、
我已经完成了
Pyspark
dataframe
的
逻辑,现在必须应用不同
的
输入并组合结果。我
的
附加逻辑是广泛
的
,但仍然完全
使用
sql,所以我不确定运行时缓慢是由于查询还是for循环。
浏览 0
提问于2019-07-03
得票数 1
1
回答
将pandas数据帧
转换
为spark数据帧时收到错误
、
、
由于在spark中没有对读取
excel
文件
的
开箱即用
的
支持,所以我首先将
excel
文件
读取到pandas数据帧中,然后尝试将pandas数据帧
转换
为spark数据帧,但我得到了以下错误(我
使用
sparkimport SQLContext pdf=pd.read_
excel
('/home/testdata/test
浏览 0
提问于2016-01-15
得票数 2
1
回答
将错误赋值为目录未找到错误
的
Pyspark
命令
、
、
、
、
我已经在Anaconda ( Macbook中
的
@ OS )上安装了ApacheSpark
和
Pyspark
,也没有安装Hadoop!。/usr/local/lib/
python
3.8/site-packages/
pyspark
/bin/load-spark-env.sh:没有这样
的
文件
或
目录 /Library/Frameworks/
Py
浏览 3
提问于2020-02-01
得票数 0
1
回答
使用
python
脚本删除.xls中
的
行
我是
python
新手,但到目前为止,我想要做
的
是删除扩展名为.xls
的
excel
文件
中
的
几行。
Excel
版本为2007。我知道我们可以
使用
xlrd xlwt包,但我不知道需要执行哪些函数调用来删除
行
或
列
。我只删除那些包含具有特定
文件
的
特定
列
的
行
。我知道open_workbook
和
读取
行
浏览 0
提问于2012-11-22
得票数 0
1
回答
动态填充中
的
列名
、
、
、
我正在开发一个动态脚本,它可以join任何给定
的
pyspark
。问题是
文件
中
的
列名会发生变化&连接条件
的
数目可能会有所不同。我可以在一个循环中处理这个问题,但是我
使用
一个变量名执行连接,它失败了。(我
的
目的是根据
文件
结构
和
联接条件动态填充a
和
b
或
更多
列
)a="existingFile.Id&qu
浏览 2
提问于2018-02-24
得票数 0
回答已采纳
1
回答
在
使用
Python
中
的
Polars读写Parquet
文件
时,我可以指定模式吗?
、
、
、
、
当
使用
Python
中
的
Polars读取CSV
文件
时,我们可以
使用
参数dtypes来指定要
使用
的
模式(对于某些
列
)。我想知道我们在读
或
写Parquet
文件
时能做同样
的
事情吗?我有一些从
PySpark
生成
的
Parquet
文件
,并希望将这些Parquet
文件
加载到Rust中。锈蚀需要无符号整数,而火花/
PySpark
浏览 13
提问于2022-05-20
得票数 1
1
回答
是否需要编辑
excel
文件
(.xlsb)中
的
几个单元格,并
使用
客户端凭据将编辑后
的
excel
文件
上传到sharepoint?
、
、
、
我
的
工作是收集、编辑
和
上传
python
中
的
format.xlsb
excel
文件
,并将编辑后
的
文件
上传到sharepoint。 我不想在本地保存它,因为代码应该运行在Azure函数上。我可以从sharepoint收集
excel
文件
的
二进制
文件
,并处理它,但我想编辑
excel
,并将编辑后
的
文件
上传到相同
的
路径上,
浏览 7
提问于2022-01-26
得票数 0
5
回答
火花复制数据栏-
Python
/
PySpark
中
的
最佳实践?
、
、
这是用于
使用
Spark2.3.2
的
Python
/
PySpark
。我正在寻找最佳实践方法,将一个数据框架
的
列
复制到另一个数据框架,
使用
PySpark
对一个非常大
的
10+十亿行数据集(按年/月/日平均划分)。每一
行
都有120
列
要
转换
/复制。输出数据帧将被写入另一组
文件
中,日期分区。示例模式是:input DFinput (col
浏览 1
提问于2018-12-19
得票数 5
1
回答
Arduino SD卡
和
Excel
文件
、
我有一个Arduino SD卡,它将数据从IMU传感器保存到一个文本
文件
中。这有可能让SD卡直接将这些数据保存到
excel
文件
中吗?
浏览 3
提问于2016-04-01
得票数 0
回答已采纳
1
回答
如何将带有时区
的
奇怪日期时间字符串
转换
为时间戳(
PySpark
)
、
、
、
我有一个名为datetime
的
列
,它是一个表单字符串。Month Name DD YYYY H:MM:SS,nnn AM/PM TZ Mar 18 2019 9:48:08,623 AM MDT纳秒精度是非常重要
的
,因为日志是如此接近
的
时间。TZ是可选
的
,因为它们都在同一个
浏览 1
提问于2019-03-19
得票数 0
回答已采纳
1
回答
将非柱状文本
文件
转换
为柱状CSV/
Excel
、
、
、
、
我有一个输入文本
文件
,其中包含从PDF逐页提取
的
数据。此输入文本
文件
没有
列
和
行
格式
的
所有数据。如何将此
文件
转换
为csv
或
excel
格式,并将数据按图中所示
的
列
和
行
排列。我已经附加了样本输入
文件
以及所需
的
样本输出
文件
。是否有免费软件
或
Java/<em
浏览 2
提问于2019-11-13
得票数 1
1
回答
如何分配
python
解释器火花工作人员
使用
?
、
、
我确信
PYSPARK
_DRIVER_
PYTHON
PYSPARK
_
PYTHON
env设置成功
使用
:我想用火药作为启动
的
python
解释器
python
-m deamon 我不想将默认
pyt
浏览 0
提问于2018-02-12
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券