我正在使用Python中的搜索tweet。我想知道,是否可以使用正则表达式搜索Tweets。
我使用以下代码:
query = 'ARNOLD or SYLVESTER'
for tweet in tweepy.Cursor(api.search,
query,
count=100,
result_type="recent",
include_entities=True,
lang="en").items():例如,我是否可以搜索所有使用'ARNOLD‘或'SYLVESTER’(都是大写/单字)的tweet,而忽略所有其他的tweet。
我目前正在处理的推文后,获得所有的推文,包括阿诺德或西尔维斯特,然后检查是否所有的字符是大写。我想知道它是否可以通过API搜索本身完成。
谢谢
发布于 2014-05-01 15:35:34
不幸的是,Twitter不支持使用正则表达式搜索tweet,这意味着您必须发布处理。实际上,从Twitter到此并没有任何官方文档,但是所有人使用regex (包括我)使用Twitter搜索API 后处理 他们的推特。由于没有明确的官方立场,我在搜索查询中尝试了几乎所有类型的regex,但是我没有运气。根据Twitter搜索API文档,查询必须是:
一个UTF-8,URL编码的搜索查询最多1000个字符,包括操作符.查询还可能受到复杂性的限制。
所有查询都是UTF-8,显然都是这样搜索的。如果我们可以在API搜索调用中指定regex参数,那就太好了,但是没有。
这背后的原因很可能是在所有tweet上运行regex搜索会增加Twitter本身的处理成本。
发布于 2018-09-07 10:38:18
现在Twitter文档中有所有可用搜索操作符的完整列表。
https://developer.twitter.com/en/docs/tweets/rules-and-filtering/overview/standard-operators
我不能对最初的答案发表评论,所以我认为这对将来通过谷歌到达的访问者是有用的,因为在Twitter文档网站上很难找到。
https://stackoverflow.com/questions/23363940
复制相似问题