我使用Selenium驱动程序从LinkedIn配置文件中提取数据点。在本例中,我希望从技能部分提取每个技能,但是数据被提取为HTML格式。当试图将HTML代码转换为文本时,我会得到附加的错误消息。from parsel import Selector from selenium.webdriver.common.keys importKeys
from bs4
我想把linkedin仅用于个人用途(需要获得朋友公司页面的帖子),我正在使用Selenium和BeautifulSoup来解决这个问题。我发现每个帖子都是一个div,它们都有ember-view类,但赞助商的帖子也有这个类,我不想刮掉这个类,更深入地研究HTML代码,我发现我可以通过选择所有data-urn属性为:urn:li:activity:XXXXXXXXXX的div来选择用户帖子。但是在每个post div