我正在使用scala的azure-cosmosdb-spark库,并且我试图查询以下内容 select top 1 * from c 但我得到的最终数据帧计数是8而不是1。我怀疑CosmosDBRDDIterator将其拆分成多个分区(在本例中为8)并处理查询。 无论执行的是select查询,结果计数始终是实际结果计数的8倍。有没有什么方法可以避免这种情况,并使我的实际计数为1?
这个项目的目的是了解信息是如何在查看对象时获得的。想象一个对象有像a,b,c,d,e和f这样的元素。一个人可能看了a,然后转到b,以此类推。现在,我们希望绘制并了解此人如何在给定刺激的不同元素之间导航。我有在单个列中捕获此移动的数据,但我需要将其拆分为几列才能获得导航模式。请找到下面给出的示例。f e
我想要在数据帧中获取他们在r中计数的字符串 数据集如下所示: No Str 1 "I like travelling in Australia." 2 "I like travelling is America1 1 travelling 1 1 in 1 1 Australia 1 2 I 1 2 like 1 2 to 1 2 travelling 1 2 in 1 2 America 1 我曾尝试使用拆分第一行
我有一个数据集,列出了客户购买的一般项目。csv中的每条记录从左到右列出了客户购买的商品。Bicycle, Helmet, GlovesTelevision, Hat, Jumper, Playstation 5
我希望把它放在scala的RDD中,并对它们进行计数。第二行从csv中获取数据并将其放入rdd_1中。第三行执行平面映射,在逗号上拆分