我有一个问题,关于推特的文字的再水合物。任何帮助都将不胜感激。
这是我的数据来源,这是关于电晕推文的:
我已经下载了照片中的数据集(命名为01-2月-2020)。

然后,我过滤这些数据,向我展示“GB”中唯一的tweet,即几乎24000个tweet。

我用twarc来补充我的推文如下:
首先,使用pip安装双圆弧。
然后,在命令行中键入以下内容:twarc configure
然后,用户间密钥和密钥
然后,编写一个命令:
twarc hydrate id.txt > tweet_hydrated.jsonl但是,在24000条推特id中,我只收到了18条。

我也使用了水龙头应用程序,但结果是一样的。我做错什么了?从这么大量的数据中提取18个数据是否合乎逻辑?任何关于加水推特文本世界的新建议都将受到赞赏。(对不起,我的英语很差,我不是那个天真的演说家)
发布于 2020-08-06 12:21:45
我现在已经成功地复制了这一点,并且我相信在将JSON输入转换为CSV / Excel到Tweet列表的过程中,您可能正在使用JavaScript (?)而Tweet ID就失去了准确性。线索是当我注意到Excel列中以0000结尾的所有Tweet in时。您将需要使用一种更精确的方法将Tweet ID设置为tw圆弧。
发布于 2020-08-05 18:24:21
Tweet收集方法(复制粘贴)是不正确的。在编写了适当的代码将tweet ID保存到文本文件后,问题就解决了。
此外,安迪·派珀在评论部分提到了同样的事情,我在这里复制了这部分内容。
如何将下载的JSON格式转换为CSV格式?我想知道Tweet值是否有效。- Andy 5个小时前,我已经成功地复制了它,我相信在将您的JSON输入转换为CSV / Excel到Tweet列表的过程中,您可能正在使用JavaScript (?)而Tweet ID就失去了准确性。线索是当我注意到Excel列中以0000结尾的所有Tweet in时。您需要使用一种更精确的方法将Tweet ID设置为tw圆弧
https://stackoverflow.com/questions/63254995
复制相似问题