腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
pyspark
dataframe
中
添加
前缀
和
重置
索引
python
、
pandas
、
pyspark
下面是我
在
熊猫身上经常做的事情 cdr = datamonthly.pivot(index="msisdn", columns="last_x_month", values="arpu_sum").add_prefix('arpu_sum_l').reset_index() 但我
在
皮斯帕克所做的 cdr = datamonthly.groupBy("msisdn").pivot("last_x_month").sum
浏览 55
提问于2021-08-31
得票数 0
回答已采纳
1
回答
FInd数据帧
中
的第一个非零元素
python
、
dataframe
、
pyspark
我正在处理一个
pyspark
dataframe
,并尝试查看是否有一种方法可以提取spark
dataframe
中
第一个非零元素的
索引
。我自己
添加
了
索引
列,因为
pyspark
不支持它,而不是pandas。
浏览 29
提问于2021-10-08
得票数 0
1
回答
Pyspark
-> StringIndexer:用数字替换“无”值
apache-spark
、
pyspark
(self.rawData, columnName) @staticmethod indexer = indexer.fit(
dataFrame
)
dataFrame
= indexer.transform(<
浏览 1
提问于2018-04-29
得票数 0
1
回答
如何在不丢失模式的情况下用
PySpark
的JDBC覆盖数据?
apache-spark
、
pyspark
、
apache-spark-sql
我有一个愿意写入PostgreSQL数据库的
DataFrame
。但问题是,我希望将主键
和
索引
保留在表
中
。因此,我想要么只覆盖数据,保留表模式,要么
在
之后
添加
主键约束
和
索引
。其中任何一个都可以用
PySpark
完成吗?或者,我需要连接到PostgreSQL并执行命令来自己
添加
索引
吗?
浏览 3
提问于2018-04-04
得票数 7
5
回答
DataFrame
对象没有属性“col”
apache-spark
在
“火花:最终指南”
中
,它说: df.col("count") 但是,当我
在
包含列count的
dataframe
上运行后的代码时,就会得到错误'
DataFrame
' object has no
datafram
浏览 2
提问于2018-08-12
得票数 9
2
回答
在数据库环境
中
尝试合并或连接两个
pyspark
.sql.
dataframe
.
DataFrame
python
、
python-3.x
、
dataframe
、
pyspark
我
在
中有两个数据仓库。两种类型都是:
pyspark
.sql.
dataframe
.
DataFrame
Error Message: TypeError: cannot concatenate object of type "<class '
pyspark
.sql.
dataframe
.
Da
浏览 8
提问于2020-02-06
得票数 0
回答已采纳
1
回答
向类
添加
功能的最佳方法-
PySpark
python
、
pandas
、
dataframe
、
oop
、
pyspark
有一段时间,我
在
寻找如何将多个列一次重命名为一个
PySpark
DF,并遇到了如下情况:def rename_sdf(df, mapper={}, **kwargs_mapper,其中通过赋值语句将方法
添加
到
pyspark
.
DataFrame
类
中
。问题是,我正在创建一个Github来存储我的所有函数
和
ETL,我认为如果我能够应用上面显示的逻辑,就可以非常容易地创建一个__init__.py模块,在其中实例化我的所有功能,
浏览 6
提问于2020-07-09
得票数 1
6
回答
如何在python/
中
的所有列
中
添加
后缀
和
前缀
python
、
apache-spark
、
pyspark
、
spark-dataframe
我想要做的是,对于所有的列名,我想在列名的开头
和
列名的末尾
添加
回滴答(`)。column name is testing user.I want `testing user` 有没有一种方法可以
在
pyspark
/python
中
做到这一点。当我们应用代码时,它应该返回一个数据帧。
浏览 3
提问于2017-04-01
得票数 18
回答已采纳
1
回答
将多
索引
的内容替换为
DataFrame
列
pandas
假设我有一个带有MultiIndex的
DataFrame
,如下所示Out[88]: integrate 2 0.083333 如何将MultiIndex的内容重新插入到常规列
中
,
浏览 2
提问于2013-02-12
得票数 1
回答已采纳
2
回答
如何使用matplotlib绘制
pyspark
sql结果
python
、
pandas
、
matplotlib
、
pyspark-sql
我对
pyspark
是个新手。我想使用matplotlib绘制结果,但不确定使用哪个函数。我寻找了一种将sql结果转换为pandas然后使用plot的方法。
浏览 9
提问于2017-07-10
得票数 14
回答已采纳
1
回答
海豚
中
的表是如何像熊猫一样实现再
索引
功能的?
index
、
index-tuning
在
Pandas
中
,可以通过
重置
索引
操作来重新排序现有数据。如果在原始
Dataframe
或系列
中
不存在
重置
索引
标签,则元素值。我可以问一下如何在DolphinDB
中
实
浏览 0
提问于2022-12-26
得票数 0
4
回答
PySpark
java.io.IOException:方案没有FileSystem : https
pyspark
、
apache-spark-sql
、
pyspark-sql
990.s3.amazonaws.com/201611339349202661_public.xml") 1135 for temp_arg in temp_args: C:\SPARK_HOME\spark-2.2.0-bin-hadoop2.7\python\
pyspark
浏览 87
提问于2017-11-17
得票数 4
回答已采纳
2
回答
如何将List[String]值
添加
到数据帧
中
的单个列
scala
、
apache-spark
我有一个
dataframe
,我有一个值列表(可能是列表字符串),我想在我的
dataframe
中
创建一个新列,并将这些列表值作为列值
添加
到这个新列。c_df)((df, column) => df.withColumn("newcolumnname" , lit(column)))
浏览 0
提问于2019-01-03
得票数 0
3
回答
如何将pandas
中
的单热点编码列重命名为其各自的
索引
?
python
、
pandas
此行
添加
一个包含0
和
1的列,其名称的格式为prefix_categoricalValue我希望列的名称是它的
索引
,而不是prefix_categoricalValue。我知道我可以做像df.rename(columns={'pre
浏览 2
提问于2018-08-30
得票数 1
2
回答
使用java将
索引
列
添加
到apache spark Dataset<Row>
java
、
apache-spark
下面的问题有scala
和
pyspark
的解决方案,而这个问题提供的解决方案不是针对连续
索引
值的。Spark
Dataframe
:How to add a index Column : Aka Distributed Data Index 我
在
Apache-spark中有一个现有的数据集,我想根据
索引
从中选择一些行我计划
添加
一个包含从1开始的唯一值的
索引
列,并根据该列的值提取行。我找到了下面的方法来
添加
使用order by的
索
浏览 41
提问于2019-05-16
得票数 2
回答已采纳
2
回答
pyspark
.pandas
和
熊猫有什么区别?
pandas
、
pyspark
开始
在
Databricks上使用
PySpark
,我看到我可以
在
pandas的同时导入
pyspark
.pandas。有什么不同吗?我想这不像koalas,对吧?
浏览 13
提问于2022-09-20
得票数 0
1
回答
根据存储
在
另一列(Pandas)
中
的列
索引
选择列值
python
、
pandas
pandas as pd 'Column1':['Spark',10000,'Python','35days'], 'ind':[1,2,
浏览 4
提问于2022-05-20
得票数 1
回答已采纳
1
回答
熊猫数据
索引
& loc
python
、
pandas
有一个名为DFF的Pandas
Dataframe
,如下所示:SalesOrder SOItem SLNo 4501034 20 1 ZH names=['SalesOrder', 'SOItem', 'SLNo']) 还有另一个名为SDD的Panda
浏览 12
提问于2022-11-30
得票数 -3
2
回答
将数据保存到HDFS的格式是什么?
hadoop
、
apache-spark
、
hdfs
、
apache-spark-sql
创建
DataFrame
后,我可以将其保存为avro、csv或拼板格式。
在
dataframe
或rdd
中
是否有其他格式可用于
在
Hadoop中保存数据?
浏览 2
提问于2017-12-21
得票数 1
1
回答
识别
pyspark
中
列值的第一次出现,然后根据它增加另一列。
pyspark
当我
在
火花放电
中
遇到一个新的客户id时,我正试图增加一个列-
pyspark
.sql.
dataframe
.
DataFrame
类型,它有2列Customer_id 101 101010101010101010103,每当一个新的Customer_ID标志值被
重置
为1时,当遇到相同的id时增加。
浏览 2
提问于2020-04-05
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券