使用Selenium & Beautifulsoup从python中的LinkedIn帖子中拉出评论计数

使用Selenium和Beautifulsoup从Python中的LinkedIn帖子中拉出评论计数的方法如下：

首先，确保已经安装了Selenium和Beautifulsoup库。可以使用以下命令进行安装：

pip install selenium
pip install beautifulsoup4

导入所需的库：

from selenium import webdriver
from bs4 import BeautifulSoup

创建一个WebDriver对象，启动浏览器：

driver = webdriver.Chrome()  # 使用Chrome浏览器，需要提前安装ChromeDriver并配置到系统环境变量中

打开LinkedIn的帖子页面：

post_url = "LinkedIn帖子的URL"
driver.get(post_url)

使用Selenium模拟滚动页面，以加载所有评论：

# 模拟滚动到页面底部
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")

获取页面源代码：

page_source = driver.page_source

使用Beautifulsoup解析页面源代码，提取评论计数：

soup = BeautifulSoup(page_source, "html.parser")
comment_count = soup.find("span", {"class": "v-align-middle"}).text

打印评论计数：

print("评论计数：", comment_count)

完整代码示例：

from selenium import webdriver
from bs4 import BeautifulSoup

driver = webdriver.Chrome()
post_url = "LinkedIn帖子的URL"
driver.get(post_url)

# 模拟滚动到页面底部
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")

page_source = driver.page_source

soup = BeautifulSoup(page_source, "html.parser")
comment_count = soup.find("span", {"class": "v-align-middle"}).text

print("评论计数：", comment_count)

这个方法使用Selenium模拟浏览器操作，打开LinkedIn的帖子页面，并使用Beautifulsoup解析页面源代码，提取评论计数。注意，需要提前安装Chrome浏览器和ChromeDriver，并将ChromeDriver配置到系统环境变量中。

推荐的腾讯云相关产品：腾讯云服务器（https://cloud.tencent.com/product/cvm）和腾讯云数据库（https://cloud.tencent.com/product/cdb）可以用于部署和存储相关的应用。

使用Selenium & Beautifulsoup从python中的LinkedIn帖子中拉出评论计数

python、selenium、web-scraping、beautifulsoup

我正在开发一个python脚本，它使用Selenium & BeautifulSoup通过web抓取从我个人的LinkedIn配置文件中提取性能数据。我可以通过Chrome成功地访问我的个人资料，并提取一些数据，但评论似乎很棘手。这是我到目前为止所知道的： postComments = [] #beautiful soup instance: soup =

浏览 11提问于2021-09-22得票数 0

2回答

Python3代码问题

python、python-3.x、web-scraping

q=linkedin+" + n + "&t=hb&ia=web") "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6) "/Library/Frameworks/Python.framework/Versions/3.6/

浏览 6提问于2017-04-28得票数 0

回答已采纳

2回答

findAll找到了一些但不是全部

python、html、selenium、selenium-webdriver、beautifulsoup

有了一些Python知识，我试着做了一些LinkedIn公司的文章抓取。使用下面的代码(我从获取的代码)，公司LinkedIn页面上的所有帖子都是在提取内容之前首先找到的。问题是，我已经计算过了，无论我使用哪个解析器lxml、html5lib或html.parser，都会返回比lxml函数更多的帖子。在一种情况下，它返回67条帖子中</

浏览 10提问于2022-06-06得票数 0

回答已采纳

2回答

LinkedIn刮刀:如何将公司名称列表转换为LinkedIn URL？

python、selenium、web-scraping、beautifulsoup、linkedin

我使用Python、Selenium和BeautifulSoup构建了一个BeautifulSoup网络刮刀器，它接收公司的LinkedIn网址，并输出有关公司的信息，例如它的竞争对手。我遇到的问题是，我的输入是公司名称的列表。有什么方法可以将这个公司名称列表转换成一个LinkedIn URL列表，我可以将其输入到网络刮板中吗？谢谢。

浏览 4提问于2022-01-05得票数 1

1回答

使用BeautifulSoup和Selenium拉取所有文本(多个p标记)将返回[]

python、selenium、beautifulsoup

我正在尝试将p标记注释提取到一个审查卡中，最终使用BeautifulSoup和Selenium通过这个在vivino.com上循环搜索。我能够打开第一个链接，但在评论框中拉出p文本将返回[]。webdriver.Chrome('/Users/myname/Downloads/chromedriver')driver.get(url) python

浏览 0提问于2020-03-06得票数 0

1回答

如何使用php从linkedin获取评论、分享和点赞数量

php、api、linkedin

如何使用PHP从linkedin页面获取帖子的评论、分享和点赞计数include 'simplelinkedin.class.php';

浏览 0提问于2013-12-24得票数 3

1回答

将HTML数据转换为文本格式

python、selenium、selenium-webdriver、selenium-chromedriver

我使用Selenium驱动程序从LinkedIn配置文件中提取数据点。在本例中，我希望从技能部分提取每个技能，但是数据被提取为HTML格式。当试图将HTML代码转换为文本时，我会得到附加的错误消息。from parsel import Selector from selenium.webdriver.common.keys importKeys from bs4

浏览 3提问于2019-04-28得票数 2

回答已采纳

1回答

将HTML数据转换为文本格式- Python

python、html、selenium、selenium-webdriver

我使用Selenium驱动程序从LinkedIn配置文件中提取数据点。在本例中，我希望从技能部分提取每个技能，但是数据被提取为HTML格式。当试图将HTML代码转换为文本时，我会得到附加的错误消息。from selenium import webdriver from

浏览 2提问于2019-04-28得票数 0

回答已采纳

1回答

Python: Selenium & PhantomJS

python、selenium、web-scraping、beautifulsoup、phantomjs

results-count-string Sans-15px-black-55% pb0 pl5 pr4"> </div> browser.get(index_url) soup = BeautifulSoup我认为这是在执行java脚本时所

浏览 1提问于2017-08-02得票数 1

回答已采纳

2回答

BeautifulSoup:按类属性刮表--为什么我得不到任何数据？

python、beautifulsoup、screen-scraping

我正在尝试使用来擦拭位于BeautifulSoup的滴答符号。目前，我尝试了以下几种方法：import BeautifulSouphtml = urllib.urlopen(url).read() soup = BeautifulSoup</em

浏览 5提问于2014-06-04得票数 0

回答已采纳

3回答

漂亮的汤没有加载整个页面

python、beautifulsoup、web-crawler

我有一个网页爬行脚本from lxml import htmlres = requests.get('https://in.linkedin.com) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}) 请将代码中url中的“ASAMPLEUSERNAME”替换为

浏览 0提问于2018-07-06得票数 1

回答已采纳

1回答

我想把linkedin仅用于个人用途(需要获得朋友公司页面的帖子)，我正在使用Selenium和BeautifulSoup来解决这个问题。我发现每个帖子都是一个div，它们都有ember-view类，但赞助商的帖子也有这个类，我不想刮掉这个类，更深入地研究HTML代码，我发现我可以通过选择所有data-urn属性为：urn:li:activity:XXXXXXXXXX的div来选择用户帖子。但是在每个post div

浏览 16提问于2020-03-18得票数 1

1回答

如何使驱动程序导航到selenium* python中的新页面*

python、selenium、selenium-webdriver、automation、web-testing

我正试图用selenium和python编写一个脚本来自动化Linkedin上的求职申请。这些步骤很简单： from selenium import webdriver from

浏览 0提问于2021-08-12得票数 1

回答已采纳

1回答

未找到Pipenv模块

python、python-3.x、virtualenv、pipenv

我已经有一段时间没有用Python进行开发了，看到pipenv进入这个场景，我真的很兴奋。然而，我在使用它时遇到了一些问题。我安装了pipenv，然后使用了pipenv install beautifulsoup4。我的理解是，这应该已经创建了一个pipfile和一个虚拟环境。所以我启动了pipenv shell。瞧，我的文件在那里，还有美丽的汤。我想做的下一件事是pipenv install selenium。我写了这个非常简短<e

浏览 1提问于2018-03-20得票数 4

回答已采纳

1回答

在BeautifulSoup中处理无限滚动UI

python、beautifulsoup

我正在研究如何抓取Linkedin source (https://www.linkedin.com/mynetwork/invite-connect/connections/)，但似乎不可能使用无限滚动我不想使用Selenium (稍后我想实现为web服务)。import bs4import requests

浏览 27提问于2020-01-19得票数 1

回答已采纳

2回答

如何在硒中启用无头铬JavaScript

javascript、python、selenium、beautifulsoup、twitter

import requestsfrom selenium import webdriverfrom selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver

浏览 3提问于2021-05-20得票数 1

3回答

Python硒多处理

python、python-3.x、selenium、web-scraping、multiprocessing

我用python和selenium结合编写了一个脚本，从它的登陆页面中抓取不同帖子的链接，并通过跟踪指向其内部页面的url最终获得每个帖子的标题。虽然我在这里分析的内容是静态的，但我使用selenium来查看它在多处理中的工作方式。然而，我的意图是使用多处理进行抓取。到目前为止，我知道<em

浏览 2提问于2018-11-26得票数 31

回答已采纳

2回答

如何在使用selenium查看站点时从Linkedin的帖子中获得确切的日期？

selenium、web-scraping、linkedin

我正在使用selenium驱动程序来抓取Linkedin的配置文件。我正在为我的职位做分析。这是从Linkedin的帖子中获得准确日期的方法，格式是"dd.mm.yyyy“，而不是”1个月前“、"2周前”？帮帮忙，杰西克

浏览 0提问于2020-08-24得票数 4

2回答

为什么使用selenium时只能获取首页数据？

python、selenium-webdriver、web-scraping

我使用python包selenium自动单击"load more“按钮，这是成功的。但是为什么在“加载更多”后无法获取数据？我想用python从imdb抓取评论。它只显示25条评论，直到我点击“加载更多”按钮。我使用python包selenium自动单击"load more“按钮，这是成功的。但是为什么我不能在“加载更多”之后获取数据，而只是重复获取前25条<

浏览 0提问于2019-04-05得票数 2

3回答

网络抓取LinkedIn并没有给我html..。我做错什么了？

python、html、selenium、web-scraping、beautifulsoup

因此，我试图在LinkedIn的“关于页面”上进行网络搜索，以获得某些公司的“特长”。当尝试用漂亮的汤刮LinkedIn时，它给了我一个访问被拒绝的错误，所以我使用一个头来伪造我的浏览器。但是，它提供了这个输出，而不是相应的HTML： \n\nwindow.onload = function() {\n //分析cookies中的跟踪码。对于\n // fr

浏览 0提问于2019-04-19得票数 4

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用Selenium & Beautifulsoup从python中的LinkedIn帖子中拉出评论计数

相关·内容

使用Selenium & Beautifulsoup从python中的LinkedIn帖子中拉出评论计数

Python3代码问题

findAll找到了一些但不是全部

LinkedIn刮刀:如何将公司名称列表转换为LinkedIn URL？

使用BeautifulSoup和Selenium拉取所有文本(多个p标记)将返回[]

如何使用php从linkedin获取评论、分享和点赞数量

将HTML数据转换为文本格式

将HTML数据转换为文本格式- Python

Python: Selenium & PhantomJS

BeautifulSoup:按类属性刮表--为什么我得不到任何数据？

漂亮的汤没有加载整个页面

如何使用regex和属性选择元素

如何使驱动程序导航到selenium* python中的新页面*

未找到Pipenv模块

在BeautifulSoup中处理无限滚动UI

如何在硒中启用无头铬JavaScript

Python硒多处理

如何在使用selenium查看站点时从Linkedin的帖子中获得确切的日期？

为什么使用selenium时只能获取首页数据？

网络抓取LinkedIn并没有给我html..。我做错什么了？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐