使用python从scrappng推文中排除帐户

使用Python从推文中排除帐户可以通过以下步骤实现：

首先，你需要安装Python的相关库，如requests、beautifulsoup等，以便进行网络请求和HTML解析。
使用requests库发送HTTP请求，获取推文的页面内容。可以使用推特的API或者直接爬取推特网页。
使用beautifulsoup库解析HTML内容，提取出推文的相关信息，如推文文本、推文作者、推文时间等。
对于排除帐户，你可以通过判断推文作者是否在排除的帐户列表中来进行过滤。可以将排除的帐户列表存储在一个文本文件或数据库中，然后在代码中读取并进行判断。
如果推文作者不在排除的帐户列表中，你可以将推文保存到一个文件或数据库中，或者进行其他处理。

下面是一个示例代码，演示如何使用Python从推文中排除帐户：

import requests
from bs4 import BeautifulSoup

# 定义排除的帐户列表
excluded_accounts = ['account1', 'account2', 'account3']

# 发送HTTP请求，获取推文页面内容
response = requests.get('https://twitter.com/username')

# 解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')

# 提取推文信息
tweets = soup.find_all('div', {'class': 'tweet'})

# 遍历推文
for tweet in tweets:
    # 提取推文作者
    author = tweet.find('span', {'class': 'username'}).text
    
    # 判断推文作者是否在排除的帐户列表中
    if author not in excluded_accounts:
        # 提取推文文本
        text = tweet.find('p', {'class': 'tweet-text'}).text
        
        # 提取推文时间
        time = tweet.find('span', {'class': '_timestamp'}).text
        
        # 进行其他处理，如保存到文件或数据库
        print(f'Author: {author}')
        print(f'Text: {text}')
        print(f'Time: {time}')
        print('---')

这个示例代码使用requests库发送HTTP请求，使用beautifulsoup库解析HTML内容，然后提取推文的作者、文本和时间信息。然后，它会判断推文作者是否在排除的帐户列表中，如果不在，则打印推文的相关信息。你可以根据自己的需求进行进一步的处理和修改。

腾讯云相关产品和产品介绍链接地址：

腾讯云官网：https://cloud.tencent.com/
云服务器（CVM）：https://cloud.tencent.com/product/cvm
云数据库 MySQL 版：https://cloud.tencent.com/product/cdb_mysql
云原生应用引擎（TKE）：https://cloud.tencent.com/product/tke
云存储（COS）：https://cloud.tencent.com/product/cos
人工智能平台（AI Lab）：https://cloud.tencent.com/product/ailab
物联网开发平台（IoT Explorer）：https://cloud.tencent.com/product/iothub
腾讯移动开发平台（腾讯移动开发者平台）：https://cloud.tencent.com/product/mmp
腾讯区块链服务（TBaaS）：https://cloud.tencent.com/product/tbaas
腾讯云元宇宙：https://cloud.tencent.com/product/uc

使用python从scrappng推文中排除帐户

、、

我想用互联网服务提供商名称形式的关键字从Twitter上抓取一条推文，但我想从该互联网服务提供商中排除客户服务帐户。我应该在我的代码中添加什么？

浏览 25提问于2020-10-02得票数 0

1回答

Twitter流API:仅显示针对用户的tweet和来自用户的tweet

、、、、

我使用Twitter流API来检索某个用户编写的tweet。为此，我使用然而，我不仅得到这个用户ID的tweet，而且我猜还会回复、转发(?)有没有办法可以排除其他消息？此外，我想得到所有的推文，是针对这个人，所以所有的推文中提到了这个帐户。因此，我会使用。然而，我在这里遇到了同样的问题，因为我收到了相当多的推文，这些推文不仅

浏览 7提问于2021-09-23得票数 1

1回答

Tweets在公共时间线上不可用，但tweet不是protected...what可能是原因？

、

我开始使用Twitter搜索API来创建我们公司的多个twitter流的视图。对于其中一个帐户，搜索API仅返回对该帐户的提及(即在其他人的推文中)，但不返回来自该帐户的推文。该帐户的推文不受保护。为了确保这不是我的代码，我也在上测试了它，推文也没有显示出来。

浏览 0提问于2010-10-21得票数 0

回答已采纳

1回答

从.NET网络服务调用Python脚本

、、、、

从.NET web服务执行Python脚本时出现问题。只有在web服务的上下文中运行时，它才会失败。如果我使用runas打开一个cmd shell，

浏览 0提问于2012-03-23得票数 0

回答已采纳

2回答

因此，我目前试图从Twitter帐户挖掘推文，但我想排除转发，这样我就可以为我的项目获得200条推文数据。目前，我有一个可以工作的代码来挖掘数据馈送，但仍然包含了Re-Tweets。我发现，要排除Re-Tweets，您需要在代码中放入-RT，但我根本不知道放在哪里，因为我对编程非常陌生。(当前使用Twitter API for Python (Tweepy)和使用Spyder的Python 3.6。)

浏览 0提问于2018-04-18得票数 2

1回答

从R的推文中删除合适的英语单词

、、、

我正在使用R处理推特数据，并试图从推文中删除所有合适的英语单词。这个想法是为了查看我记录过的某个特定人群的口语化缩写、错别字和俚语。示例：在上面提到的操作之后，我希望只有'af‘ 我想过用字典(我会下载)来处理推文任何用Python编写的解决方案都会有所帮助。

浏览 5提问于2016-07-14得票数 2

1回答

移除一股海角

、

使用storyboard，我创建了4个视图控制器的流。我有一个UINavigation控制器，它有一些视图控制器作为它的根视图。从根本上看，我可以一直走到第四视图。

浏览 3提问于2014-05-25得票数 0

回答已采纳

1回答

如何让ifttt完成格式正确的自动转发？

、、

我正试图在ifttt.com中设置一个菜谱，以转发从account samplesourceuser到account sampletargetuser的所有内容(当然，我控制了这两个帐户，当然名称已经编辑过流量/推特级别不高。我制作了一个菜谱，看上去有点像这样：( ifttt.com中配置的twitter帐户是sampletargetuser的) 然而，在账户B的结果推文中，@总是被遗漏，这使得它看起来像RT samplesourceuser

浏览 0提问于2015-03-21得票数 3

1回答

从用户的时间线获取tweet

、

我试图从用户的每一条推文中检索文本。我不发送get请求。我成功地将一个tweeter帐户连接到我的应用程序中： {Toast.makeText(getApplicationContext(), "Login failed", Toast.LENGTH_LONG).show(); }); 结果，我可以从我的用

浏览 2提问于2017-05-17得票数 1

回答已采纳

1回答

Tweepy MyStreamListener会被调用吗?即使这个人不是在发微博？

、、

我正在使用StreamListener制作一个Tweepy程序，它等待一个帐户发送推文，将推文保存为txt文件，替换字符，然后发送更新的txt文件。当我将帐户设置为我自己的帐户@Bobwont时，它工作得很好。等待@Bobwont发tweet，将tweet另存为txt文件，替换字符并发送文本。当我将账号设置为@Zackfox时，它似乎会从他的个人资料中删除推文，而不是等待他发推文。我不知道该怎么解释。我已经发布了我的代码和终端进程。

浏览 15提问于2019-01-30得票数 0

1回答

TWTweetComposeViewController中“From：”字段的默认值

、

如果用户在其设备上设置了超过1个推特帐户，我希望能够控制哪个帐户用户名是TWTweetComposeViewController中From字段的默认值。目前，它似乎默认为系统上的第一个Twitter帐户，我看不到任何方法来改变这一点。

浏览 0提问于2012-05-13得票数 0

回答已采纳

2回答

iOS TWTweetComposeViewController -在后台发布

、

我正在尝试将推特集成到iOS5应用程序中。在我的应用程序中使用Twitter框架，我可以在后台发布消息吗？我知道使用TWTweetComposeViewController，它会显示一个视图，然后它会发布。这个是可能的吗？

浏览 1提问于2011-12-30得票数 0

回答已采纳

2回答

如何让用户在推特上发布图片？

、、

我们有一个twitter按钮设置，用户点击它，弹出窗口打开，让用户从自己的帐户推文。我们如何在推文中包含图片呢？(有了facebook，我们已经能够做到这一点)。

浏览 0提问于2013-03-03得票数 1

回答已采纳

1回答

使用Python将推文导入到csv文件

、

我想导入推文和日期从特定人的Twitter帐户张贴到CSV文件使用Python。我得到了所有的数据，但date转到了twitter post的下面(下一行)，而不是下一列。我希望推特在第一列和日期张贴在下一列。你能帮帮我吗。谢谢

浏览 0提问于2017-10-09得票数 0

1回答

有没有办法排除推特搜索结果中提到特定术语的账户？

、

目前，它们被人们使用用户名中的一个关键字抛出。 -(@username) -from:username一个想法是创建一个帐户列表来排除，然后过滤

浏览 3提问于2019-07-31得票数 2

回答已采纳

2回答

获取在twitter上关注某个人的所有用户

、、、

我对python和Twython(我们可以用来从twitter上检索tweet的库)的概念还很陌生。现在我正在检索tweet，使用twitter=Twython()我得到了想要的推文，但现在我想知道有多少人在关注一个特定的用户。在推文中，我们可以了解到关注的人数 for tweets in u

浏览 0提问于2013-01-03得票数 1

2回答

如何使用Python从twitter推文中删除图片URL

、、

我有一个来自picture的数据，我正在尝试从文本中删除图片URLOutput：大家好，祝您今天愉快。*[\r\n]*', str(x))[0]) 谢谢:-)

浏览 2提问于2020-01-29得票数 0

3回答

如何从我的个人Twitter帐户中获取我的推特信息出现在我公司的Twitter帐户中

我已经建立了一个个人推特帐户和一个公司推特帐户。我有我的公司推特帐户跟踪我的个人帐户。我的想法是，我希望在公司推特账户的“主页”上显示我在推特上发布的所有内容。我正在使用各种平台/应用程序(例如，inkedIn、Posterous等)。在我的个人推特账户下发推文。然而，令我沮丧的是，我从另一个应用程序发送的所有推文都没有显示在我的关注者

浏览 0提问于2010-10-15得票数 0

1回答

如何获取tweet视频&使用获取100多条tweet

、、

我正在使用‘。$_POST‘关键字’‘获取搜索关键字的tweet。我可以得到100推特，但我需要显示完整的3200推特。我怎么处理这个？如何从推文中获取视频？

浏览 1提问于2015-04-01得票数 1

1回答

如何在Git Bash for Windows中切换github用户？

、

我有两个GitHub帐户，并希望使用其中一个帐户推送到存储库，让我们称它为account A。但问题是，我的Git总是与另一个推，帐户B。我相信这是因为我第一次下载Git (很久以前)时，我将我的用户配置为帐户B，但我不知道如何切换它们。我关闭了Git Bash并再次安装，这次没有凭据帮助功能，甚至到控制面板并排除了关于GitHub的通用凭据，但每次提交时，它都是与B帐户有关。事实上，在我重新安装并排除了通用凭据之后，Git Bas

浏览 4提问于2021-01-14得票数 1

回答已采纳

点击加载更多