由于要解析的原始数据的内容,我最终得到了长度不同的“用户列表”和“tweet列表”。当将列表作为数据框中的列写入时,我得到了ValueError: arrays must all be same length。我意识到了这一点,但一直在寻找一种方法来解决这个问题,在较短数组的正确位置打印0或NaN。有什么想法吗?import pandassoup = BeautifulSo
我正在尝试将Apache中的熊猫DataFrame转换为PCollection。不幸的是,当我使用to_pcollection()函数时,我得到以下错误: AttributeError: 'DataFrame' object has no attribute '_expr' 有谁知道怎么解决这个问题吗我使用的是pandas=1.1.4、beam=2.25.0和Python3.6.9。