腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
不
更改
列名
的
情况下
创建
PySpark
数据
框
、
、
、
我使用下面的CTAS命令使用SparkSQL
创建
表。FROM TBL1 在那之后,我正在使用下面的
PySpark
代码读取新
创建
的
位置(TBL2)下面的文件。但是,下面的data frame仅使用lowercase中
的
所有
列名
创建
。而预期
的
结果是
在
camel case中,就像我在上面对CTAS所做
的
那样。
浏览 12
提问于2019-12-23
得票数 1
回答已采纳
2
回答
在
pySpark
中按条件分割
数据
、
、
、
我想
创建
两个dataframes,1)只使用True
列名
,2)只使用假
列名
。我最初
的
想法是
创建
两个dataframes (因为它们稍后将被附加到一个更大
的
数据
集中),或者我还考虑将适当
的
列名
转换为一个列表,然后将列表名称转换为
列名
。我是
pySpark
新手,我想知道如何在
不
硬编码任何
列名
(我有几百列)
的
情况下
做到这一点,我知道我不
浏览 3
提问于2020-05-07
得票数 1
回答已采纳
3
回答
使用火花sql重命名Parquet文件中
列名
中
的
空格
、
我想使用Spark来显示拼花文件
的
内容,但是由于parquet文件中
的
列名
包含空格,所以我得到了错误--属性名"First“包含”,;{}()\n\t=“中
的
无效字符。请使用别名重命名它。spark.read.parquet("filepath")r2.select(r2("First Name").alias("FirstName")).show() 但还是会犯同样
的
错误
浏览 0
提问于2018-09-16
得票数 5
3
回答
删除
pyspark
中所有
列名
中
的
空格
我是
pySpark
的
新手。我收到了一个csv文件,大约有1000列。我正在使用databricks。大多数这些列之间有空格,例如“总收入”,“总年龄”等。我需要更新所有的
列名
与空格下划线‘_’。我已经试过了但它在databricks上
的
Pyspark
中不起作用。
浏览 1
提问于2019-08-02
得票数 1
1
回答
在
pyspark
的
现有dataframe中添加新列
的
方法是什么?
、
、
、
我已经
在
现有的
数据
框
中添加了一个新列,但它没有反映在
数据
帧中。如果我们可以将
数据
帧分配给另一个
数据
帧,我们就可以看到结果test.show() 有没有办法向现有的dataframe添加一个新
的
列(不复制dataframe)?我们只有一个选择(熊猫中<e
浏览 4
提问于2021-01-26
得票数 0
1
回答
R中
的
列绑定
、
、
我
在
R中使用cbind命令将许多data.frames绑定在一起,并且每个
数据
框
都有相同
的
列名
,因此当我绑定它们时,R会自动将
列名
从原始名称
更改
。例如,有一个名为"X“
的
列,因此对于每个绑定,它将其重命名为X.1、X.2、X.3等。有没有一种方法可以让我
在
不
更改
任何
列名
的
情况下
绑定它们,并拥有多个同名
的
列?我希望这样做
浏览 2
提问于2013-02-28
得票数 1
回答已采纳
3
回答
蜂巢兽人返回零
、
、
、
我正在
创建
hive外部表ORC (位于S3上
的
ORC文件)。命令运行查询后
的
:|有趣
的
是,返回
的
记录数量为10,而且它是
浏览 7
提问于2017-10-24
得票数 1
2
回答
PySpark
自定义项,仅输入处
的
值为None
、
、
、
、
我
在
我
的
Kafka流媒体应用程序中
的
UDF函数有问题。每次调用UDF函数时,输入上只有None值,而不是有效列值。然后引发TypeError,因为应用程序需要str,而不是None。.withColumn("destinationAS", get_asn('destinationIPv4Address'))TypeError: search_best() argument 1 mu
浏览 16
提问于2020-05-06
得票数 0
1
回答
pyspark
如何使用json模式为csv文件读取不同日期格式
、
、
在
csv文件
的
json schema中,
pyspark
是否可以使用dateformat参数读取不同
的
日期格式?{ 使用.option(dateFormat)只能读取一种格式
的
日期,如何读取其他格式
的
日期。(或)
在
不
浏览 1
提问于2021-05-05
得票数 0
1
回答
复制
pyspark
数据
框
中
的
列
、
我
在
pyspark
中有一个类似下面示例
的
数据
框
。我想复制
数据
框
中
的
列,并将其重命名为另一个
列名
。Name Age RateBen 32 98期望
的
输出为: Name Age
浏览 5
提问于2018-05-18
得票数 13
回答已采纳
1
回答
将函数应用于
数据
框
列表将移除
数据
、
、
下面是一些与我正在处理
的
数据
相似的模拟
数据
: df1 <- data.frame(Date.Time..GMT.04.00 = c(1, 2, 3, 4, 5),,这样我就可以对每个
数据
帧应用一个函数: df.list <- list(df1, df2) 下面是我编写
的
函数: change_date_name <- function(df){ colnames(df) <- sub("^Date.Time..GMT.0\\d.00", "Date_
浏览 8
提问于2020-06-29
得票数 2
回答已采纳
2
回答
如何在不引用旧
列名
和
不
创建
新
数据
框
的
情况下
更改
列名
?
、
我知道我可以通过执行以下操作来
更改
列名
: df = df.rename(columns = {old_name: new_name}) 但是我必须重命名很多名称,而且旧名称很长,所以我只想传递一个新名称
的
列表如果我将新列设置为自己
的
数据
框架,则可以很好地工作: ranks = sw[sw.columns[9:15]] ranks.columns = ['ranking_1', 'ranking_2', 'ranking_3', 'ran
浏览 13
提问于2020-10-06
得票数 2
1
回答
如何使用lambda函数
更改
pandas df中任意列
的
名称?
、
、
、
有没有办法使用lambda
更改
pandas dataframe中
的
某些
列名
,而不是全部?例如,假设此
数据
框
具有名称为osx、centos、ubunto、windows
的
列。在这个
数据
框
中,我想用x附加
的
列名
替换所有
列名
,所以
在
本例中,我可以用以下方式重命名
列名
:但是,如果我
浏览 3
提问于2013-05-27
得票数 9
回答已采纳
1
回答
json文件模式/对象到用于加载
数据
帧
的
spark模式
、
、
、
、
我必须使用
pySpark
加载很多文件到hive表中。有多个包含
数据
的
不同json文件和定义文件
数据
模式
的
单独文件。
在
不
传递模式
的
情况下
加载文件时,
数据
列变得无序,这就是我想要
创建
模式
的
原因。我
的
想法是将这个文件作为字典读取,提取“属性”键值作为
列名
和
数据
类型,然后以某种方式为spark dataframe加载到hive生成模式。
浏览 2
提问于2018-07-14
得票数 0
4
回答
在
PySpark
dataFrame中给特定单元格赋值
、
、
、
我希望使用Spark DataFrame
的
PySpark
在
特定
的
单元格中
更改
一个值。简单
的
例子--我
创建
了一个模拟Spark DataFrame [ (4我知道df.iloc[4, 3] = 'new_orleans'或df.loc[4, 'detroit'] = 'ne
浏览 4
提问于2018-05-17
得票数 7
回答已采纳
1
回答
如何查看表结构sql查询?
、
、
我想
创建
一个新
的
表,就像MySQL
数据
库中
的
现有表一样,并对“
列名
”进行一些
更改
。那么,有没有办法
在
不
导入
的
情况下
查看现有表
的
SQL转储呢? ?
浏览 7
提问于2019-05-02
得票数 1
回答已采纳
1
回答
如何在删除行时
不
更改
列名
、
如何在
不
更改
列名
的
情况下
从
数据
框
中删除行?我
的
意思是:> df11 335 如你所见,我美丽
的
名字消失了。当然,我可以
在
删除后保存我
的
列名
来重命名新
的
数据
帧,
浏览 4
提问于2020-11-12
得票数 0
回答已采纳
9
回答
R:向空
数据
框
添加行时丢失
列名
、
、
、
我刚从R开始,遇到了一个奇怪
的
行为:
在
一个空
的
数据
框
中插入第一行时,原来
的
列名
就丢失了。row.names)#[1] "one" "two"a#1 5 6#[1] "X5" "X6" 如您所见,
列名
谁能告诉我为什么会发生这种情况,有没有一种正确
的
浏览 135
提问于2011-03-08
得票数 77
回答已采纳
7
回答
具有可变
列名
的
动态update语句
、
、
我们希望
在
几个SQL Server
数据
库中执行更新,将某个表中
的
所有空值
更改
为空字符串,而不是NULL。我们可能会在数百个
数据
库中做到这一点。表名将始终是相同
的
,但是
列名
是根据前端应用程序
的
配置而变化
的
(不要判断...我没有
创建
这个系统)。 有没有办法
在
不
事先知道
列名
的
情况下
对所有这些列进行更新?
浏览 1
提问于2012-10-12
得票数 20
回答已采纳
1
回答
如何对以空格命名
的
表和列进行编程?
、
、
有一个
数据
库,其中包含许多用空格和
列名
命名
的
表、报告和窗体。最初
创建
数据
库时并不打算使用VBA,现在我们尝试在其中编程,我们面临着如何在
不
更改
表名和
列名
的
情况下
进行查询和编程
的
巨大挑战。非常感谢您
的
意见。
浏览 1
提问于2014-12-20
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券