腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8358)
视频
沙龙
1
回答
为
什么用
美
汤
找不到
一些
链接
python
、
pdf
、
web-scraping
、
beautifulsoup
我正在使用漂亮的
汤
(bf4)找到所有的
链接
,引用一个pdf文件在给定的网站页面。pdf.close() print("All PDF files downloaded") 问题是,正如我们通过打印找到的
链接
所看到的那样,只有页面的“静态”部分(顶部和底部的类别)被考虑在内,而主体部分(有pdf文件的地方)中的任何
链接
都没有被分析,这意味着我最终没有下载pdf。有人知道我如何才能
浏览 73
提问于2021-03-01
得票数 0
回答已采纳
1
回答
利用
美
汤
获取数据--pids
python-3.x
、
web-scraping
、
beautifulsoup
我正在尝试使用Python3中的Beautiful Soup来抓取下面的网站。 由于类不是恒定的,每个玩家都会改变,所以我在提取div时遇到了麻烦。soup.find_all('div',{'class','leaderboard-item'})
浏览 10
提问于2018-08-14
得票数 0
回答已采纳
1
回答
从复杂网站抓取数据(隐藏内容)
python
、
python-3.x
、
beautifulsoup
我刚刚开始从网络抓取,不幸的是,我面临一个展示:我想要拉
一些
财务数据,但它似乎是相当复杂的网站(动态内容等)。 到目前为止,我已经用了
美
汤
来完成这件事。但是,我甚至
找不到
桌子。
浏览 0
提问于2018-06-18
得票数 0
回答已采纳
1
回答
我能从Pyhton中有多个
链接
的网页中解析和导出信息吗?
python-3.x
基本上,我想从解析和导出到Excel的表头(名称,类型,年份,年龄组),然后填充它与疾病,但更重要的是,与
链接
内可用的信息(人口,建议,等级)。我的想法是,我不知道如何解析
链接
中的信息-例如,以第一个
链接
疾病(腹主动脉瘤:筛查)
为
例,这是包含我需要的信息的页面-
美
汤
是解决之道吗?我是一个新手,所以任何帮助都是非常感谢的。非常感谢!
浏览 2
提问于2019-09-04
得票数 0
2
回答
在本地内容上使用漂亮的
汤
python
、
html
、
beautifulsoup
我开始了一个研究项目,使用带有本地
链接
和镜像选项的wget抓取页面。我当时这样做是为了获得数据,因为我不知道这些网站会活跃多久。所以我有60-70个网站完全镜像的本地化
链接
坐在一个目录。我意识到漂亮
汤
的设计是为了获取http请求并从那里解析。老实说,我对
美
汤
还不是很了解,我的编程技能也不是很棒。现在我有
一些
时间投入其中,我想用简单的方法而不是手动的方式来做这件事。
浏览 5
提问于2017-01-10
得票数 1
1
回答
如何使用
美
汤
从kick starter获取以下数据?
web-scraping
、
beautifulsoup
、
kickstarter
我正在尝试从kick starter获取
一些
数据。如何使用
美
汤
库?Kick Starter
链接
Crowdfunding goalTotal backers Length of the campaign (#
浏览 3
提问于2019-06-10
得票数 0
2
回答
如果我只能为python选择一个html抓取库,我应该选择哪一个呢?
python
、
parsing
、
search
、
web-crawler
我需要做很多html解析/抓取/search引擎/crawling。现在我不想尝试每一个,然后再做决定。基本上,我想跟随其中一个,然后详细研究,然后最常使用它。可以在lxml中进行索引吗?PyQuery与lxml是相同还是不同?
浏览 1
提问于2011-06-06
得票数 1
回答已采纳
2
回答
Python相当于Javascript的jQuery或Node的cheerio?
jquery
、
python
、
api
、
node.js
、
cheerio
我的用例是:解析包含javascript/css文件引用的任何脚本或
链接
标记的文件。
浏览 8
提问于2013-03-21
得票数 6
回答已采纳
2
回答
阅读来自MLB网站的游戏统计表,进入美丽的
汤
python
、
beautifulsoup
我似乎
找不到
/捕获不到类名。当我在chrome中“检查HTML”时,我可以看到类名,但是
美
汤
似乎没有发现它。 是否有
一些
解决方法/技巧可以让它正确地进入?
浏览 21
提问于2019-06-25
得票数 0
回答已采纳
5
回答
LinkedIn网络抓取
data-mining
、
social-network-analysis
、
crawling
、
scraping
最近,我发现了一个用于连接到新R包 API的LinkedIn。不幸的是,从一开始,LinkedIn API似乎是非常有限的;例如,您只能获得公司的基本数据,这与个人的数据是不同的。我想获取某一公司所有员工的数据,您可以使用在现场手动操作,但是通过API是不可能的。是否有人知道适用于LinkedIn站点当前格式的任何web抓取工具或技术,或者如何弯曲API以进行更灵活的分析?最好是基于R或网络,但肯定对其他方法开放。
浏览 0
提问于2015-05-13
得票数 11
回答已采纳
2
回答
不统计文件中的正确字符
python
、
python-3.x
我有以下代码,它按预期运行,但在计算字符数和最长行的长度时有
一些
问题。最长的一行总是显示
为
比正确答案多一行。美丽的
汤
,如此浓郁和青绿,在热腾腾的图腾中等待!对于这样的美味,谁不会屈尊呢?晚上的
汤
,美丽的
汤
!晚上的
汤
,美丽的
汤
!美味的
汤
!谁会关心鱼、野味或其他菜肴呢?谁不愿意为两便士的
美
汤
付出一切呢?彭尼沃斯,只有美丽的
汤<
浏览 11
提问于2018-08-13
得票数 0
回答已采纳
1
回答
无法在网站上找到要爬行的BeautifulSoup的类名
python-3.x
、
beautifulsoup
我对
美
汤
很陌生。实际上,我想为多所大学做网页抓取,所以我希望使用URL,我可以为不同的大学格式化(只需更改大学名称)。
浏览 3
提问于2020-06-11
得票数 3
回答已采纳
1
回答
BeautifulSoup允许我抓取
一些
文章,但不允许其他文章(来自同一份报纸)
python
、
beautifulsoup
我正在试着用
美
汤
刮新闻。然而,它只适用于网站上的
一些
文章,而不适用于其他文章。我在源代码中
找不到
任何明显的差异,所以我将非常感谢任何关于如何解决这个问题的想法。
浏览 5
提问于2020-03-17
得票数 0
1
回答
抓取元素在页面源中不可见
python
、
selenium
、
web-scraping
、
beautifulsoup
我试着在这里找到一个解决方案,到目前为止,这是我能想出的代码(硒+
美
汤
的组合) import requestsfrom selenium importtherapist_menu_id = "downshift-7-menu" print(soup.find(id=therapist_menu_id)) 我认为让Selenium等待15秒可以确保所有元素都已加载,但我仍然在
汤
中
找不到
任何id
为
downshift-7-menu
浏览 21
提问于2020-12-27
得票数 1
回答已采纳
2
回答
Beautiful Soup的extract()出错
python
、
beautifulsoup
我正在开发
一些
屏幕抓取软件,遇到了
美
汤
的问题。我使用的是python 2.4.3和Beautiful Soup 3.0.7a。tag.extract() for tag in bad_tags] print i输出
为
:
浏览 0
提问于2009-05-12
得票数 0
回答已采纳
4
回答
获取html中特定标记之间的数据。
ios
、
objective-c
、
html
、
html-parsing
我想从html数据中获取特定标签之间的数据。 <li> <ul> <li>Unique anchor designs provide multiple points of fixation along the device, allowi
浏览 1
提问于2013-09-12
得票数 0
2
回答
使用python漂亮
汤
从oreilly媒体站点中提取图书名称
python
、
html
、
beautifulsoup
我正在尝试从oreilly媒体网站上提取书名,使用python漂亮的
汤
。 我试图打开html中的
一些
链接
,并搜索书名,但什么也
找不到
。 是否可以使用美丽的
汤
从网站中提取第一或第二本书的名字?
浏览 10
提问于2022-02-27
得票数 0
回答已采纳
2
回答
.findAll()从网页中
找不到
任何内容
python
、
web-scraping
、
beautifulsoup
为了从google商店中拉出评论,我正在尝试学习图书馆的
美
汤
。我写了一个代码,应该可以得到所有的评论(包括星级,日期和审阅者的名字),但输出只是一个空列表。这个问题可能是
一些
非常基本的问题,我只是太缺乏经验而不知道。page_html, "html.parser")len(reviews) 输出
为
0
浏览 22
提问于2019-05-31
得票数 0
回答已采纳
1
回答
无法抓取Reddit的NBA页面
python
、
web-scraping
、
beautifulsoup
我是网络爬虫的新手,我想学习如何使用漂亮的
汤
将其集成到一个迷你项目中。我在他的上关注了thenewboston关于
美
汤
的教程,然后被卡住了,试图从Reddit上爬出来。我想在上抓取每个NBA新闻的标题和
链接
,但没有任何成功。在终端中返回的唯一内容就是“进程已完成,退出代码
为
0”。我有种感觉这跟我的选择有关?任何指导和帮助都将不胜感激。
浏览 1
提问于2017-10-18
得票数 0
1
回答
美丽
汤
的托架影响豆蔻输出
python
、
beautifulsoup
、
mustache
我正在尝试插入html代码,这是分析与美丽
汤
,到一个模板与pystache (胡子),并遇到
一些
主要的张贴问题。 'main' : main_txt,html_main = pystache.render(template, values)// div.rbtoc1386636254365 我到处找遍
浏览 2
提问于2013-12-18
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
无需优盘直接安装Win7,Win8,Win10电脑系统!
免费的LocalSend实现电脑和手机无线互传
美团外卖征集绿色包装方案
工资总不够花,可以尝试做副业,适合上班族的兼职创业项目
曾融资近亿元的“吃个汤”门店全部关闭!经营不善还是卷款跑路?
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券