识别 Twitter 句柄涉及以下步骤:
首先,需要导入所需的库和模块,例如 re
、datetime
和 twitter
。
import re
import datetime
import tweepy
使用 tweepy.API_keys()
函数来取得 API 金钥和令牌,需要将金钥和令牌存储在设定档中。
api_keys = tweepy.API_keys()
api_key = api_keys['API_key']
api_secret_key = api_keys['API_secret_key']
access_token = api_keys['access_token']
access_token_secret = api_keys['access_token_secret']
使用 tweepy.Cursor
函数来撷取推文,并且需要指定使用者帐号、推文数量和指定要撷取的特定时间区段。
user = tweepy.Cursor(api.users_show_time_zone, id=123456789)
tweets = []
for tweet in user:
tweets.append(tweet)
使用 re
函数来过滤掉非推文的文字,并且将文字转换为小写。
filtered_tweets = [tweet for tweet in tweets if re.search(r'^\w+', tweet.text)]
使用 tweepy.Cursor
函数来撷取推文附件,并且需要指定使用者帐号、推文数量和指定要撷取的特定时间区段。
tweet_attachments = tweepy.Cursor(api.tweets_attachments, id=123456789, tweet_mode='extended')
tweet_attachments = tweet_attachments.items(tweet_attachments_count)
使用 tweepy.Cursor
函数来建立搜索引用来下载附件,并且需要指定使用者帐号、推文数量和指定要撷取的特定时间区段。
search_results = tweepy.Cursor(api.search_tweets, q='text:example', lang='zh-cn', tweet_mode='extended').items(tweet_attachments_count)
使用 tweepy.Cursor
函数来下载附件,并且需要指定使用者帐号、推文数量和指定要撷取的特定时间区段。
for search_result in search_results:
for tweet in search_result:
filename = tweet.id
with open(filename, 'wb') as f:
f.write(tweet.media
领取专属 10元无门槛券
手把手带您无忧上云