我有两个rdd,我想对rdd1的每个项进行一些rdd1项的计算。因此,我在用户定义的函数中传递RDD2,如下所示,但是我得到了类似于rdd1 cannot be passed in another rdd的错误。如果我想在两个rdd上执行操作,我可以知道如何实现这个目标吗?RDD1.map(line =>function(line,RDD2))
我想要一个查询,对一个字段进行全文搜索,然后对另一个字段进行排序(想象按发布日期搜索一些文本文档和顺序)。该表大约有17M行,它们在日期上大致均匀分布。这将在webapp请求/响应周期中使用,因此查询最多必须在200 is内完成。SELECT * FROM table WHERE MATCH(text) AGAINST('query') ORDER BY date=my_date DESC LIMIT 10;ALTER TABLE table ADD FULLTEXT index_name(te