腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(663)
视频
沙龙
1
回答
如何
大写
所有
pyspark
dataframe
条目
(
列名
保持
相似
)
、
、
、
这是我的数据集 lastvalue_month
DataFrame
[msisdn: string, year: string, month: string, day: string, date_id:hpos_from_ios: string, hptype_to_smart: string, hptype_from_smart: string, hpbrand_change: string]` 这是我的代码 from
pyspark
.sqlhptype_from_smart) AS `hptype_from_smart`'>, Colum
浏览 15
提问于2021-09-03
得票数 1
回答已采纳
1
回答
将
pyspark
数据框的列转换为小写
、
、
、
我有一个
pyspark
格式的
dataframe
,它的列是
大写
的,比如ID、COMPANY等等我们
如何
做到这一点?
浏览 0
提问于2017-03-25
得票数 18
回答已采纳
2
回答
如何
使用Java将数据库的
列名
更改为
大写
、
、
、
我有一些混合的
列名
,比如sum(TXN_VOL),我想把它们转换成
大写
字母,比如SUM(TXN_VOL)我尝试的是: Dataset<Row我已经在许
浏览 1
提问于2019-01-02
得票数 0
回答已采纳
1
回答
PySpark
:根据值中的字符列出
列名
、
在
PySpark
中,我试图清理一个数据集。一些列的值中有不需要的字符(=“")。假设列总是包含类似的
条目
,我只使用数据集的最后一行。中尝试了以下操作,但是它返回
所有
的
列名
:for x in df.columns: columns_to_fix.append(x)columns_to_fix: ['id', 'value3
浏览 0
提问于2018-09-24
得票数 1
回答已采纳
2
回答
在
pySpark
中按条件分割数据
、
、
、
我有一个
dataframe
值为false、true或null。我想创建两个dataframes,1)只使用True
列名
,2)只使用假
列名
。我最初的想法是创建两个dataframes (因为它们稍后将被附加到一个更大的数据集中),或者我还考虑将适当的
列名
转换为一个列表,然后将列表名称转换为
列名
。我是
pySpark
新手,我想知道
如何
在不硬编码任何
列名
(我有几百列)的情况下做到这一点,我知道我不能遍历行,因为这样做会违背
pySpark
的目的
浏览 3
提问于2020-05-07
得票数 1
回答已采纳
1
回答
PySpark
数据帧转换
、
、
我有以下数据帧:from
pyspark
import SparkContext [11, 'abc',str+'_'+str(val),结果表填充相应的val,<em
浏览 17
提问于2019-07-30
得票数 0
回答已采纳
2
回答
Pyspark
:获取
列名
的子字符串
、
、
、
我是
PySpark
新手,我想要更改我的
列名
,因为它们中的大多数都有一个烦人的前缀。我的专栏名称如下:e1014_var2Data_date_stampfor col in df.columns: df= df.withColumnRenamed(col, col.upper())
浏览 2
提问于2021-08-31
得票数 1
回答已采纳
1
回答
如何
在
dataframe
上基于模式应用不同的选择
列名
?
、
我有两个不同的数据源,模式和
列名
略有变化。例如: col("id"),是否有任何方法可以让模式意识到并选择对
列名
上的位置或次要名称更
浏览 4
提问于2022-07-19
得票数 0
1
回答
如何
自动向JabRef上的
所有
条目
添加大括号?
、
当我从.bib下载IEEEExplore项目时,即使原始标题没有
大写
,纸质标题也会用小写格式格式化--为了
保持
原始格式,我必须在标题周围手动添加花括号。
如何
设置JabRef以向
所有
库
条目
添加大括号,以
保持
标题
大写
?
浏览 5
提问于2022-07-25
得票数 0
1
回答
pySpark
toRowMatrix混淆
、
、
我正在尝试通过
pyspark
使用columnSimiliraties
pyspark
.__version__ test我相信这是最后一行,全是0--但理想情况下,我想知道
所有
的行,outputted...any,我该
如何
得到方阵?
浏览 1
提问于2017-08-24
得票数 0
1
回答
Pyspark
使用.filter()过滤掉空列表
、
、
、
我有一个
pyspark
dataframe
,其中一列填充了列表,要么包含
条目
,要么只包含空列表。我想高效地过滤掉
所有
包含空列表的行。import
pyspark
.sql.functions as sf也许为了清楚起见,我有多个列,但想要在单个列上应用上面的过滤器,
浏览 17
提问于2017-02-24
得票数 7
回答已采纳
1
回答
pySpark
3.0
如何
裁剪
所有
列的空格[复制]
、
、
这个问题在这里已经有答案了 : 在
Pyspark
Dataframe
中修剪 (3个答案) 3天前就关门了。 对于此数据帧:
如何
修剪循环中每列的
所有
前导空格和尾随空格?types. ['col1', 'col2','col3'] # add your columns label here df.show(5) 我知道
如何
通过如下方式指定每一列,但需要对循环中的
所有
列执行此
浏览 19
提问于2021-02-26
得票数 0
回答已采纳
3
回答
使用性能选择操作重命名
PySpark
DataFrame
中的列
还有关于
如何
在
PySpark
DataFrame
中重命名列的其他线程,请参阅、和。我不认为现有的解决方案具有足够的性能或通用性(我有一个应该更好的解决方案,而且我被一个边缘案例错误困住了)。,但它还不够通用,而且对于许多列来说,手工操作太多了(例如,如果您试图将2,000个
列名
转换为snake_case) importa|| sam|
浏览 5
提问于2020-07-16
得票数 2
1
回答
熊猫自动从
列名
的系列列表中创建数据
、
如何
创建对象的数据格式,
列名
是创建对象的函数的名称?因此,要创建常规的
dataframe
,我有:但是,我目前还没有办法将
所有
的functionA__name__, etc.作为
列名
插入到
dataframe
中。 我
如何
保持
同样的简洁性,并设置
列名
?
浏览 0
提问于2015-12-12
得票数 2
回答已采纳
2
回答
根据数据帧转换各个列的数据类型
我有一个包含100个cols的pysaprk数据帧:我有另一个
pyspark
dataframe
df2,具有相同的列计数和
列名
称,但数据类型不同。df2=[(col1,bigint),(col2,double),(col3,string),..so on]
如何
使df2中
所有
cols的数据类型与其各自cols的
dataframe
df1中存在的数据类型相同
浏览 3
提问于2018-01-03
得票数 0
1
回答
将列重命名时丢失行(Azure databricks)
、
、
databricks中运行了一条火花放电线:在这行代码之前和之后,
dataframe
随机丢失了一堆行。如果在行之前和之后进行计数,那么行数就会下降。导入为F df = df.toDF(*F.col( column_name ),用于column_name in df.columns) 在df.Column:-1中,
浏览 3
提问于2022-09-21
得票数 0
1
回答
如何
降低ArrayType或MapType列中
PySpark
中元素名称的大小写?
、
、
我试图降低
PySpark
Dataframe
模式的
所有
列名
的情况,包括复杂类型列的元素名。|-- key: timestamp (nullable = true)但是,我只能使用下面的脚本降低
列名
的情况:schema = df.schema schema.fields = list(map(lambda f
浏览 0
提问于2021-06-15
得票数 0
回答已采纳
1
回答
大熊猫
列名
分配的
大写
优先
、
为什么Pandas中的
列名
分配更倾向于
大写
而不是小写?示例: 'altitude':[3158,3000,2762]})dframe =
DataFrame
({'City&
浏览 3
提问于2015-05-31
得票数 2
回答已采纳
2
回答
规则
列名
称区分大小写
、
、
但现在当我尝试查询数据库时:我得到一个错误' column _ name ',因为我们的mssql数据库服务器被设置为使用区分大小写的
列名
,而规则是强制我的
所有
列名
都是小写的。我
如何
设置规则来
保持
敏感度(更好)或使其
大写
?
浏览 4
提问于2010-11-09
得票数 2
1
回答
将大熊猫数据栏中的
条目
转换为标题,只有在它们都是
大写
的情况下
一些用户在
大写
中输入他们的姓名和地址。我想出了
如何
将熊猫的
dataframe
列转换为标题大小写(df‘last’= df.last_name.str.title() ),但这会混淆某些姓,比如McWhirter,它变成了Mcwhirter。很抱歉,如果这是一个菜鸟的问题,但是否有任何方法有选择地应用标题大小写的
条目
,只有在
所有
大写
?
浏览 2
提问于2022-05-09
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一个Python大数据处理利器:PySpark入门指南
PySpark,大数据处理的Python加速器!
python起步学习(三)
一文读懂PySpark数据框
Python科学计算之Pandas
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券