首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >为什么我不能在24000条推特ids中,用TWARC/ hydrator应用程序补充超过18条微博呢?有谁知道更好的方法吗?

为什么我不能在24000条推特ids中,用TWARC/ hydrator应用程序补充超过18条微博呢?有谁知道更好的方法吗?
EN

Stack Overflow用户
提问于 2020-08-04 21:02:33
回答 2查看 677关注 0票数 0

我有一个问题,关于推特的文字的再水合物。任何帮助都将不胜感激。

这是我的数据来源,这是关于电晕推文的:

数据集来源

我已经下载了照片中的数据集(命名为01-2月-2020)。

然后,我过滤这些数据,向我展示“GB”中唯一的tweet,即几乎24000个tweet。

我用twarc来补充我的推文如下:

首先,使用pip安装双圆弧。

然后,在命令行中键入以下内容:twarc configure

然后,用户间密钥和密钥

然后,编写一个命令:

代码语言:javascript
运行
复制
twarc hydrate id.txt > tweet_hydrated.jsonl

但是,在24000条推特id中,我只收到了18条。

我也使用了水龙头应用程序,但结果是一样的。我做错什么了?从这么大量的数据中提取18个数据是否合乎逻辑?任何关于加水推特文本世界的新建议都将受到赞赏。(对不起,我的英语很差,我不是那个天真的演说家)

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-08-06 12:21:45

我现在已经成功地复制了这一点,并且我相信在将JSON输入转换为CSV / Excel到Tweet列表的过程中,您可能正在使用JavaScript (?)而Tweet ID就失去了准确性。线索是当我注意到Excel列中以0000结尾的所有Tweet in时。您将需要使用一种更精确的方法将Tweet ID设置为tw圆弧。

票数 0
EN

Stack Overflow用户

发布于 2020-08-05 18:24:21

Tweet收集方法(复制粘贴)是不正确的。在编写了适当的代码将tweet ID保存到文本文件后,问题就解决了。

此外,安迪·派珀在评论部分提到了同样的事情,我在这里复制了这部分内容。

如何将下载的JSON格式转换为CSV格式?我想知道Tweet值是否有效。- Andy 5个小时前,我已经成功地复制了它,我相信在将您的JSON输入转换为CSV / Excel到Tweet列表的过程中,您可能正在使用JavaScript (?)而Tweet ID就失去了准确性。线索是当我注意到Excel列中以0000结尾的所有Tweet in时。您需要使用一种更精确的方法将Tweet ID设置为tw圆弧

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63254995

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档