我有一个PySpark DataFrame,它有一个字符串列text和一个单独的list word_list,我需要计算在每个text行中出现多少个word_list值(可以多次计数)。6 || this is a text | 2 |
对于文本的第一个值,在第二行中,word_list中唯一出现的值是"o“,并出现两次。在text的第三个
我在pyspark中有一个数据框架,如下所示 df = spark.createDataFrame([('123', '2021-01-01', 1815, 9876), | 223|2021-02-01| 1828|9878|
+------+----------+------+----+ 此数据框基于基于以下内容 1) For each group where numbe