如何在pyspark中通过删除列中的字符自动批量重命名

文章/答案/技术大牛

发布

1回答

、、、

'data_yield_sum_l61.0'] 我想删除整个数据帧中的所有.0。该怎么做呢？

浏览 12提问于2021-09-01得票数 0

回答已采纳

1回答

用火花放电流到HBase

、、、

在线上有相当数量的关于使用Scala进行星火流的批量加载的信息( 是特别有用的)，以及一些用于PySpark的信息，但是使用PySpark似乎缺乏这样的信息。所以我的问题是：任何语言中的大多数示例都只显示每一行上的一个列。如何在每

浏览 2提问于2016-01-29得票数 3

1回答

我正在使用一个自定义函数作为reduce操作的一部分。对于下面的例子，我得到了下面的消息TypeError: reduce() takes no keyword arguments -我相信这是由于我在函数exposed_colum中使用字典mapping的方式from pyspark.sql import DataFrame, Rowfrom pyspark.sql importSpain| Bob| | 22| Fran

浏览 18提问于2020-02-05得票数 0

回答已采纳

3回答

如何有效地批量重命名pyspark中的列？

、

我正尝试在PySpark中批量重命名我的列，从： 'collect_list(Target_Met_1)[1]' --> 'AB11' 'collect_list(Target_Met_1)[150]' -->

浏览 99提问于2019-06-22得票数 1

回答已采纳

1回答

Pyspark删除多列连接后的列

、、

我尝试在pyspark中对两列进行左连接，其中只有一列的名称是相同的：如何删除连接的数据帧df2.date和df2.accountnr的两列 dfAll = ( .join(df2, how = 'left') )

浏览 30提问于2019-02-10得票数 0

2回答

在bash中使用通配符复制多个文件

假设我们有一个名为debug.log的文件。您可以使用以下任一命令创建一个名为debug_BACKUP.log的副本：cp debug{,_BACKUP}.log 或者，用cp替换mv来重命名文件。我们希望创建名为debug1_BACKUP.log和debug2_BACKUP.log的副本。是否有一个单一的命令来实现这一点？

浏览 5提问于2019-11-07得票数 0

回答已采纳

2回答

批量重命名列postgresql

、、

是否可以在postgresql中对特定类型的所有列进行批量重命名。我有一系列的表，它们都有几何类型的列(每个表只有1个)，名称如"the_geom“、"geom”、"SP_GEOMETRY“等，由于使用不同的导入工具，它们都有不同的名称。我希望能够将它们全部重命名为"the_geom“或"geom”。

浏览 6提问于2011-12-08得票数 1

2回答

pyspark: dataframe头部转换

、、、、

我正在将csv加载到pyspark dataframe中。我正在尝试删除列标题中的空格和更多特殊字符，如"("，")“和"/”。我可以删除列标题中的空格，如下所示。它只删除列中的空格，而不删除特殊字符。我试了一下，它起作用了。df.withColumnRen

浏览 63提问于2020-12-15得票数 0

回答已采纳

1回答

基于列位置的火花重命名列

如何在PySpark中重命名数据文件的第三列。我想调用列索引而不是实际名称。以下是我的尝试：Col1 Col2 jfdklajfklfj df.withColumnRenamed([3], 'Row_Count

浏览 1提问于2020-05-28得票数 1

回答已采纳

2回答

EF迁移:自动迁移中的RenameColumn？

、、、、

如果重命名属性，Visual Studio IDE就足够智能，可以帮助您重构以在整个代码中重命名该属性。如果重命名位于EF Migrations中使用模型上，且您运行标准的自动迁移，如：你会得到这样的结果： AddColumn("NewName"...不是你想要的。显然，此时运行Add-Migration将允许您手动将这两个调用更改为对RenameColumn的</e

浏览 0提问于2012-09-11得票数 18

回答已采纳

1回答

php删除包含'&字符‘的文件

、、

我有这样的字符串路径“./music/ string & Sound.mp3”if (!unlink($path)) echo "Error while deleting file";exit();它显示了回显“删除文件时出错”，而文件未能被删除我已经尝试通过删除"&“字符来手动重命名该文件那么，如何在<

浏览 0提问于2018-11-11得票数 0

回答已采纳

43回答

在Android Studio中重命名包

基于IntelliJ IDEA，如何在新的IDE Android Studio中重命名包？我想进行批量重构，但我不知道怎么做。我在Eclipse上工作了两年，在Eclipse中只需单击鼠标即可完成操作。

浏览 22提问于2013-05-29得票数 1594

回答已采纳

2回答

在中过滤数组

、、、、

火花版本: 2.3.0 Array Col['strawberry', 'raspberry'] ['apple', 'pineapple', 'grapes']

浏览 3提问于2021-10-01得票数 1

回答已采纳

3回答

SQL Server数据类型更改

、、、

在SQL Server中，我们有一个包含8000万条记录的表，其中3列的数据类型是float。现在我们需要将float数据类型列更改为Decimal列。如何在停机时间最短的情况下进行？我们执行了通常的ALTER语句来更改数据类型，但是日志文件被填满了，并且出现了系统内存不足异常。所以请让我用更好的方法来解决这个问题。我们不能像这样使用这种技术:创建3个新的临时列，批量</e

浏览 1提问于2017-03-23得票数 3

1回答

PySpark数据帧写入orc不允许使用连字符的列名

、、、、

我是PySpark的新手。我有一个列名中包含连字符的csv文件。我可以成功地将文件读取到数据帧中。然而，当将df写入orc文件时，我得到一个错误，如下所示-当我通过删除连字符来重命名列时，我可以将数据帧写入但是我需要列名有连字符，因为我想把这个orc附

浏览 32提问于2021-02-13得票数 0

2回答

如何根据大小更改列值

、、、

我在PySpark设置中有一个dataframe。我想更改一个列，比如它叫做A，它的数据类型是"string“。我想根据它们的长度来改变它的价值。特别是，如果一行中只有一个字符，则希望将0连接到末尾。“修改”列的名称必须仍然是A。这是用于使用PySpark3的木星笔记本。这就是我迄今尝试过的： df = df.withColumn("A", when(

浏览 2提问于2019-06-17得票数 1

回答已采纳

1回答

将列重命名时丢失行(Azure databricks)

、、

，用于大写、剥离和删除字符的句号。in df.columns) ) 将pyspark.sql.functions导入为F df = df.toDF(*F.col( column_name )，用于column_namein df.columns) 在df.Column：-1中，将df.toDF(*[F.col(column_name).alias(column_name)

浏览 3提问于2022-09-21得票数 0

1回答

如何批次drop列操作？

、

我的数据库模式中有一个BLOB列，我不再需要它了。我需要把这个从我的生产服务器上删除。我在运行MYSQL-5.6 在我的开发版本上测试这一点表明，运行大约需要1.5小时。现在，对于我们来说，为了维护而使生产数据库瘫痪那么长时间是不可行的。我分批做这件事的最好方法是什么？例如，我一次可以在桌子上获得5-10分钟的写锁，而不会造成任何生产故障。我没有DB管理员的背景，所以我希望这不是其他地方讨论的一个真正的</e

浏览 0提问于2016-11-21得票数 0

2回答

替换为具有数据子集的表的副本，而不是从表中删除-最佳方法

、、

我们有一个包含800M行和93列的表，需要删除历史数据。要删除的数据占> 95%。到目前为止，批量删除的尝试都失败了，估计至少要一周才能完成。现有的索引是造成速度缓慢的主要原因。删除索引并在删除后重新构建在测试中也被证明太慢。我们决定创建一个只包含所需数据的新表，然后将旧表重命名为backup，并将新表重命名为原始数据。

浏览 14提问于2018-05-30得票数 1

2回答

如何用名称中的Windows文件路径重命名一组文件

、、

所有文件名都有相同的开头，似乎是windows文件目录。问题是，有700+文件，我真的不想通过并手动重命名所有这些文件。这些是文件名的例子(注:这些文件都没有文件目录)：G:some\really\long\file\path重要的是，每个文件在我想要的文件名之前都有G:some\really\long\file\path\then\the\。我还是Linux的新手，不知道

浏览 0提问于2017-08-24得票数 10

回答已采纳

点击加载更多