在纯文本句子中识别twitter句柄

识别 Twitter 句柄涉及以下步骤：

导入库和模块

首先，需要导入所需的库和模块，例如 re、datetime 和 twitter。

import re
import datetime
import tweepy

设定 API 金钥和令牌

使用 tweepy.API_keys() 函数来取得 API 金钥和令牌，需要将金钥和令牌存储在设定档中。

api_keys = tweepy.API_keys()
api_key = api_keys['API_key']
api_secret_key = api_keys['API_secret_key']
access_token = api_keys['access_token']
access_token_secret = api_keys['access_token_secret']

撷取推文

使用 tweepy.Cursor 函数来撷取推文，并且需要指定使用者帐号、推文数量和指定要撷取的特定时间区段。

user = tweepy.Cursor(api.users_show_time_zone, id=123456789)
tweets = []
for tweet in user:
    tweets.append(tweet)

过滤和转换文字

使用 re 函数来过滤掉非推文的文字，并且将文字转换为小写。

filtered_tweets = [tweet for tweet in tweets if re.search(r'^\w+', tweet.text)]

撷取推文附件

使用 tweepy.Cursor 函数来撷取推文附件，并且需要指定使用者帐号、推文数量和指定要撷取的特定时间区段。

tweet_attachments = tweepy.Cursor(api.tweets_attachments, id=123456789, tweet_mode='extended')
tweet_attachments = tweet_attachments.items(tweet_attachments_count)

建立搜索引用来下载附件

使用 tweepy.Cursor 函数来建立搜索引用来下载附件，并且需要指定使用者帐号、推文数量和指定要撷取的特定时间区段。

search_results = tweepy.Cursor(api.search_tweets, q='text:example', lang='zh-cn', tweet_mode='extended').items(tweet_attachments_count)

下载附件

使用 tweepy.Cursor 函数来下载附件，并且需要指定使用者帐号、推文数量和指定要撷取的特定时间区段。

for search_result in search_results:
    for tweet in search_result:
        filename = tweet.id
        with open(filename, 'wb') as f:
            f.write(tweet.media

相关·内容

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在纯文本句子中识别twitter句柄

相关·内容

如何用Python分析大数据（以Twitter数据挖掘为例）

如何用Python分析大数据（以Twitter数据挖掘为例）

Github项目推荐 | 被昨天的股票吓哆嗦了吗，试试用Trump2Cash帮你赶紧脱坑

Python3 如何使用NLTK处理语言数据

一顿操作猛如虎，涨跌全看特朗普！

拿起Python，防御特朗普的Twitter！

架构必备「RESTful API」设计技巧经验总结

隐秘通讯与跳板？C&C服务器究竟是怎么一回事

【小家思想】通俗易懂版讲解JWT和OAuth2，以及他俩的区别和联系（Token鉴权解决方案）

ElasticSearch权威指南学习（映射和分析）

理解JWT鉴权的应用场景及使用建议

Rxjs 响应式编程-第四章构建完整的Web应用程序

基于STS和JWT的微服务身份认证

「服务器」Oauth2验证框架之项目实现

知乎一条龙第二弹，API 部署开放、H5线上展示与源码共享

项目重要技术点介绍

IdentityServer4 知多少

GitHub中公开的敏感数据

Restful 接口设计最佳事件

RESTful API 设计最佳实践

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐