我有一个包含几个列的CSV文件,我想编写一个代码,它将读取一个名为'ARPU平均6个月w/t漫游和折扣‘的特定列,然后创建一个名为"Logical“的新列,该列将基于numpy.where()。我现在得到的是:
data = csv_data[['ARPU average 6 month w/t roaming and它不会为每一行创建一个具有相应值的新列。为了说明这一点:如果列中的值<
在postgres sql中,我使用regexp_substr函数解析出‘.5G’,如果它出现在productname列的字符串中。(我已经在下面包含了示例代码)。我将postgres中的regexp_replace函数的输出与pyspark进行了比较,结果返回了相同的值。所以问题一定出在regexp_extract函数中。$%^&*;:{}=_`~()-]'))), ' .5G') as A
from df 输出: ' .5G' 代码: # creating d