这是汤姆·凯特的书的摘录。
“我们使用的是一个SELECT COUNT(*) FROM T查询(或类似的内容),表T上有一个B*Tree索引。然而,优化器正在对表进行全面扫描,而不是计算(小得多的)索引条目。在这种情况下,索引可能位于一组可以包含Null的列上。因为一个完全的Null索引条目永远不会被生成,所以索引中的行数将不是表中行的计数。这里优化器正在做正确的</em
我结合使用withColumn和UDF来获取一个新列,然后选择两个列并将其分配给一个新的df。但是当我在这个新的df上运行TypeError()时,它给我的结果是:'NoneType‘对象是不可订阅的。show()运行得很好。我正在尝试获得新的df的长度。下面是我的代码: # Find all entities with names that are palindromes
# (name reads the same way forwar