我必须使用多个模式来过滤一个大文件。问题是我不确定使用rlike应用多个模式的有效方法。Liberty||19 west main street|+-------------------+
如果我从数据中使用以下两种模式(pat2)).filter(~df['poi'].rlike(pat1)).show(
我读过几篇关于使用"like“操作符通过包含字符串/表达式的条件过滤星体数据的文章,但我想知道以下是否是在所需条件下使用%s的”最佳实践“:dx = sqlContext.read.parquet(input_path) # "keyword" is a field in dx
我正在尝试获取中包含表达式my_keyword的dx