腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
我
怎样才能
连接
从
美景
汤
中
的
html
解析
中
获得
的
元素
?
、
我
有多个
html
文件,如下所示。文件
中
脚注in
的
数量可以不同,范围
从
0到数百。
我
希望ids和内容出现在csv文件
中
具有"/“分区
的
同一单元
中
。这将类似于"F1 content1/F2 content2/F3 content3/F4 content4“ 下面的代码是
我
所有的。Footnotes = soup.select('footnotes
浏览 7
提问于2019-09-13
得票数 1
回答已采纳
1
回答
需要方向-网络机器人
的
创建
我
想要创建
的
东西,将在一个网站上
的
一个特定
的
位置,并阅读在这个位置
的
价值。然后将这个值放入一个已经创建
的
文本块
中
。
我
需要做什么研究才能创造出这样
的
东西?简单
的
方向,如关键词到谷歌等,将是非常有用
的
。
浏览 3
提问于2015-09-08
得票数 0
回答已采纳
2
回答
如何
从
javafx
解析
html
并将这些数据传输到Jsoup文档?
、
、
我
试图
解析
一些文档站点
的
侧栏TOC(组件表)。
我
试过
汤
了。
我
无法
获得
TOC
元素
,因为这个标签
中
的
HTML
内容不是初始
HTML
的
一部分,而是在页面加载后由JavaScript设置
的
。你可以看到我前面的问题: 建议
的
解决方案是检查哪些
连接
是手动
从
Browser Dev T
浏览 0
提问于2018-09-17
得票数 0
回答已采纳
1
回答
缺少一些
html
表格标记
的
漂亮
汤
、
我
正在尝试从一个网站中提取数据,使用漂亮
的
汤
来
解析
html
。
我
目前正在尝试
从
以下网页获取表格数据: soup = BeautifulSoup(fh, '
浏览 22
提问于2016-09-12
得票数 0
1
回答
使用urllib和漂亮
汤
查找“隐藏”标记
中
的
值
、
、
我
想知道是否可以显示隐藏标记
的
值。
我
用
的
是易拉布和美丽
的
汤
,但我似乎得不到我想要
的
东西。下面编写了使用
html
代码im:(保存为hiddentry.
html
) ) <script type="text/javascript">
我
要打印
浏览 2
提问于2011-03-14
得票数 0
回答已采纳
3
回答
解析
美
汤
后原网页链接缺失
、
、
如果
我
的
解释很简单,请原谅。
我
对蟒蛇和美
汤
都是新手。
我
想提取与24个奖牌
获得
者在网站上
的
每个人相对应
的
链接。
我
可以
从
Firefox检查器中看到,他们
的
链接中都有“英雄”字样。然而,当我使用美丽
汤
解析
网站时,这些链接并没有出现。
我
试过使用标准
的
html
浏览 2
提问于2019-03-24
得票数 0
1
回答
如何
获得
img文本和数据-src使用优美
汤
?
、
、
HTML
片段:<a href="/profile/Smit-Soni-2" id="__w2_GDetCwt_linkassets.ec.quoracdn.net/main-thumb-18048885-50-ujrumofdevpkaarfisuvjdtbihztxnta.jpeg" alt="Smit Soni"
浏览 1
提问于2016-10-27
得票数 1
回答已采纳
1
回答
从
解析
的
网页中提取Python文本
、
、
、
、
我
正在开发一个
从
网页中提取内容
的
小系统(
我
知道已经完成了,但这是一个很好
的
练习,也是
我
需要
的
)。基本上,
我
正在寻找提取内容-内容,即,如果它是一篇文章,
我
只想要文章文本,而不是其他。
我
才刚刚开始,就当我是一张愚蠢
的
白板吧。
我
感兴趣
的
是你是如何做
的
,用什么做
的
,特别是python,但我对任何
我
发现相当有
浏览 2
提问于2012-08-31
得票数 2
回答已采纳
1
回答
为什么漂亮
汤
找不到我要找
的
html
元素
?
、
我
正试图
从
coinbase
中
获取加密货币价格
的
变化,方法是用漂亮
的
汤
进行
解析
。在coinbase网站()上,
我
可以找到价格变化
的
html
元素
。TextElement__Spacer-hxkcw5-0 caIgfs Header__StyledHeader-sc-1xiyexz-0 dLILyj">+0.33%</h4> 然后,在python
中
,
浏览 1
提问于2020-06-14
得票数 2
回答已采纳
1
回答
Python Selenium -获取所有内容并将其写入文件
、
、
、
我
怀疑太多
的
连接
尝试。..and说真的,
我
不应该每次想尝试一些新代码时都尝试
连接
,所以这让
我
想到了一个问题:所以,
我
如何才能从页面上抓取所有东西,并将其保存到...and文件
中
,然后离线加载文件以搜索
我
需要
的
字段。当我被拒绝
的
时候,
我
正在测试下面的代码,所以我不知道什么是有效
的
--下面可能有排字:/任何人能提供任何建议或改进吗?:D..but,Sers<
浏览 0
提问于2019-02-28
得票数 0
1
回答
以图形形式表示维基百科
、
、
我
想用图表
的
形式来表示整个维基百科,就像每一篇文章都是一个节点,如果一篇文章包含其他文章
的
链接,那么它们就共享一条边。因为这将是太多
的
点击,所以我需要在本地提出请求(在本地安装维基百科)。你能指导
我
如何做到这一点(告诉
我
一些有用
的
库或工具)吗?
浏览 2
提问于2016-08-15
得票数 3
回答已采纳
2
回答
在有漂亮
汤
的
字符串之前
获得
一个
元素
、
、
、
、
我
正在使用“美丽
汤
”搜索一组整数值,并生成与名称匹配
的
这些值
的
列表。然而,
我
遇到
的
问题是,网站对
我
需要
的
元素
(“列表-条目”)使用了一些非常模糊
的
类名,这些
元素
被复制在其他
元素
中
,
我
不想抓住这些
元素
。是否有一种方法,使它如此美丽
汤
只返回
元素
的
内容,而后面有一个特定
的<
浏览 1
提问于2016-12-30
得票数 1
回答已采纳
1
回答
用id网络抓取python <span>
、
、
、
、
我
想要在<span/>属性中使用BeautifulSoup为给定
的
网站报废数据。你可以在屏幕截图中看到它所在
的
位置。但是,
我
使用
的
代码只是返回一个空列表。
我
找不到我想要
的
名单上
的
数据。
我
做错了什么?opener.addheaders = [('User-agent', 'Mozilla/5.0')]
浏览 2
提问于2018-02-22
得票数 0
回答已采纳
2
回答
如何将从Chrome复制
的
css选择器路径转换为漂亮
的
路径?
、
、
、
我
一直在尝试做一个函数,当
从
Chrome开发工具复制
的
css选择器路径被给定时,它会返回漂亮
的
汤
对象。当我
从
Chrome复制一个
元素
的
css选择器路径时,它是这样
的
: body > table > tbody > tr:nth-child(2) > td.ColumnText2 如果
我
想让它成为一个合法漂亮
的
汤
类对象,我会手动
解析
它,如下所
浏览 20
提问于2019-09-27
得票数 2
回答已采纳
1
回答
如何在java
中
获取使用angularJs生成
的
页面的标题?
、
、
目前,
我
正在使用JSOUP
连接
器来获取网页
的
页面标题。但是如果网站是使用angularJs构建
的
,那么JSOUP
连接
器就无法获取标题,因为页面源
中
没有标题。System.out.println(doc.title()); e.printStackTrace();如果页面是用java构建
的
angularJs,那么如何
获得
页面的标题?
浏览 2
提问于2016-12-07
得票数 0
2
回答
python无法获取整个网页。
、
、
我
正在做一个刮擦
的
项目,在上刮取一些数据。
我
认为这可能与请求头有关,所以我复制Firefox
的
用户代理来伪造一个,只是为了发现它失败了。什么是问题,
我
该如何解决?
我
发现问题在于网页使用ajax加载一些数据,这些数据是
我
找不到
的
。
浏览 2
提问于2011-07-26
得票数 0
1
回答
不正确
的
美
汤
解析
、
、
、
通过这段代码,
我
从
BS
解析
中
获得
了以下URL:result, data = mail.uid('fetch', latest_email_uid, '(RFC822)')
浏览 3
提问于2013-10-11
得票数 0
回答已采纳
1
回答
网络刮美
汤
、
、
我
正在尝试
的
是
从
import requestsx=requests.get("https://www.walmart.comoz/34199310")print(soup.find_all("p",{"class":"Ingredients"})[0]) 但它显示
的
浏览 1
提问于2018-05-04
得票数 0
10
回答
使用Python进行Web抓取
、
、
、
我
目前正在尝试抓取一个
HTML
格式相当差
的
网站(通常缺少结束标记,没有使用类或it,因此很难直接转到您想要
的
元素
,等等)。到目前为止,
我
使用BeautifulSoup已经取得了一些成功,但偶尔(尽管很少),我会遇到一个页面,在这个页面上,BeautifulSoup创建
的
HTML
树与(例如) Firefox或Webkit略有不同虽然这是可以理解
的
,因为
HTML
的
格式使这种模棱两可,如果
我</e
浏览 3
提问于2010-03-08
得票数 9
回答已采纳
1
回答
漂亮
的
python在href
中
获取文本值,
、
、
<a href="allswell/index.
html
">Oh well Oh well</a>
我
可以使用tr['href']获取"allswell/index.
html
“ 但是
我
已经尝试了所有的文本,
元素
..
我
把这个值叫做什么?
我
如何
从
漂亮
汤
中</e
浏览 0
提问于2016-11-06
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券