腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
python
web
抓取
,
提取
标签
的
内部
元素
、
我想从一个网上购物网站刮产品和价格,在
提取
标签
之间
的
字符串需要帮助 import bs4from bs4 import BeautifulSoup
浏览 3
提问于2020-01-04
得票数 1
2
回答
获取具有特定span类
python
selenium
的
页面中
的
所有
元素
、
、
您好,我正在尝试使用
python
中
的
selenium
抓取
多个页面。我感兴趣
的
是
提取
属于span类
元素
的
所有
元素
,基本上我想做
的
是获取span类
元素
,然后
提取
其中
的
链接。下面是一个
web
元素
的
示例: 📷 基本上,我想
提取
元素
,这是一致
的
,在所有的页面,我将
抓取<
浏览 30
提问于2020-10-29
得票数 0
回答已采纳
3
回答
“汤”和“美汤”中
的
“汤”是什么意思?
、
“汤”和“美汤”中
的
“汤”是什么意思,为什么它被称为“汤”?
浏览 1
提问于2014-05-19
得票数 10
1
回答
使用正则表达式从html标记中
提取
文本
、
、
我刚接触
web
抓取
和正则表达式。我知道了如何在html
标签
之间
提取
文本。问题是我不想要
标签
内
的
文本,比如class=“",只想要
标签
之间
的
文本。>)', html) <h1 class="title">Title</h1>顺便说一下,我使用
的
是
Python
2.7.10和urllib2,然后重新导入。
浏览 3
提问于2016-04-17
得票数 1
1
回答
如何将包含多个页面的HAR转换为JSON
、
、
我正在做一个研究项目,我需要能够从大量
的
Tiktoks中
抓取
标签
。Tiktok已经采取了很多措施来对抗
web
抓取
的
正常方法,但是我发现我可以从chrome下载HAR文件并从中
提取
哈希
标签
。我发现
的
每个HAR到JSON
python
或java模块要么不工作,要么在输出JSON文件中没有hashtag信息。大多数在线HAR查看器只显示标题和参数,而我需要原始
的
JSON文件才能访问哈希
标签</em
浏览 4
提问于2022-11-06
得票数 0
3
回答
什么是好工具,自动
抓取
网站,检查某些链接,并
提取
数据?
、
我想自动
抓取
大约100万个URL(在一个CSV文件上),并检查这些站点是否提供了Facebook登录按钮(即用户可以通过将他们
的
Facebook帐户连接到站点来创建帐户)。然后,我想记录这些按钮是为哪些网站找到
的
。什么是好工具?
浏览 0
提问于2015-05-18
得票数 3
回答已采纳
1
回答
如何使用beautifulSoup对堆栈溢出问题进行
web
抓取
标记?
、
= link.get('href') for i in link: title = link.string print(title) 输出:
python
浮点舍入
python
非谷歌合作
python
flask
python
漂亮汤
python
nonetype
python
ubuntu等。在从堆栈溢出站点
提取
数据时,我们在
抓取
问题
的
标签
时遇到
浏览 0
提问于2018-03-17
得票数 0
1
回答
解析
python
中
的
html值
、
、
:0px;background-color:#f3f3f3" type="submit" value="▾"/> </td> 我需要从value="25“和value="0”中
提取
两个数字<=value=")(\d*)',str(y)) 但我认为应该有更直接
的
方法来通过解析器来做这件事,有人能帮上忙吗?
浏览 20
提问于2020-12-15
得票数 4
回答已采纳
1
回答
XPath:从多个h4标记中选择一个h4标记
、
、
我正在做一个网络
抓取
项目。因此,我检查了我
的
目标页面,并得到了下面的检查
元素
。现在有两个h4标记,随后在它们下面有两个段落。我想
提取
在h4技能
标签
下
的
段落。我
的
答案应该是
Python
,Java,Django。我怎样才能做到这一点?以下是被检查
的
元素
: <section> <h4>Skills
浏览 3
提问于2021-08-04
得票数 1
回答已采纳
1
回答
抓取
HTML标记中
的
数据Perl
、
、
、
我正在编写一个
web
scraper,并且是Perl新手。我正在使用HTML::TreeBuilder获取所需
的
数据,但我遇到了一个不确定如何处理
的
情况。下面是一些示例HTML:我想从这个超文本标记语言
标签
中
提取
val。我一直使用findvalues()来做我
的
浏览 1
提问于2013-07-15
得票数 1
回答已采纳
1
回答
为什么BeautifulSoup不
抓取
整个网页呢?
、
、
前提:我对
Python
和
web
抓取
完全陌生。我正在尝试
抓取
这个页面上
的
品牌数据:https://www.interbrand.com/best-brands/best-global-brands/2018/ranking/,但BeautifulSoup只
提取
到某个点
的
html。在html中似乎没有什么奇怪
的
,因为在BeautifulSoup
提取
之前有五个几乎相等<e
浏览 11
提问于2019-05-07
得票数 4
3
回答
如何从网站拉取信息到我
的
项目中?
、
、
我有一个问题,那就是从网站获取信息到我
的
python
项目中(当项目正在运行时)。我还没有写过任何代码,因为我是这种编程
的
初学者。我想问你,我需要哪些模块以及如何使用它们,如果你们中
的
一些人可以,我将感谢一些代码
的
例子。
浏览 1
提问于2020-09-18
得票数 0
3
回答
Selenium
Python
:从没有类
的
元素
中
提取
文本
、
、
、
、
我对网络
抓取
非常陌生。我正在研究Selenium,并希望执行从span标记中
提取
文本
的
任务。这些标记没有任何类和ids。span
标签
在li
标签
中。我需要从li标记
内部
的
span标记中
提取
文本。
元素
的
HTML: <div> <ul class
浏览 3
提问于2022-08-31
得票数 -2
1
回答
从终端运行带有模块
的
python
程序
、
我在eclipse Photon中用PyDev编写
Python
(3.6.5)已经有几个月了。这是一个小型
的
终端应用程序,可以从公司
内部
网上
的
web
(通过
web
抓取
)
提取
数据,帮助我减少工作时间,避免手动操作。结构是这样
的
:从这个集成开发环境
的
控制台中显示
的
eclipse中
的
main.py启动应用程序,但是我想要从Windows CMD启动它,以便稍后使用PyInst
浏览 0
提问于2018-05-13
得票数 0
2
回答
尝试获取除前5个标记之外
的
所有锚标记
、
、
尝试用[anchor-tag]选择所有锚
标签
,但不想
抓取
前3个都被选中
的
锚
标签
。我试过:not(),但不能让它工作。我注意到我不想
抓取
的
前3个锚点是在一个div类.
web
-container中。我尝试检查
元素
,然后按CTRL +F并找到.
web
-content a[anchor-tag],结果显示为43,当我对其进行:not(.
web
-container)加法时,得到
的
结果为0。在inspect<e
浏览 13
提问于2019-07-02
得票数 0
2
回答
python
从
web
应用程序读取数据
、
我不是
python
方面的专家,但实际上我可以读取网页并检索
标签
中
的
精确值,但我需要
的
信息是在
web
应用程序上,而不是在网页
的
源代码中。我不是一个eb应用程序
的
专家,我想知道如果我检索
的
值显示在应用程序与
python
。下面是应用程序图片
的
链接:"“
浏览 0
提问于2014-06-06
得票数 0
1
回答
使用
Python
PyQt对Javascript内容进行网页
抓取
、
、
、
我现在正在执行一项任务,系统地从似乎是由javascript呈现
的
课程列表中
抓取
内容。我在
web
上使用PyQt4遵循了一些脚本,但失败了(我在下面复制了它)。更准确地说,这个脚本在一些网站上使用javascript,它通过点击特定
的
链接来加载内容。然而,下面的网站(ouhk,我在下面的脚本中复制
的
链接)似乎没有指向特定内容
的
链接,即节目信息、节目结构和费用等。相反,它使用
标签
容器和FTP来存储和加载信息(我从其源代码中找到)。我想知道是否有任何方法可以修改以下脚本,以便
浏览 17
提问于2016-09-21
得票数 3
2
回答
有没有办法从另一个网页上
的
HTML表格中
提取
数据?
例如,如果我可以访问ESPN
的
网站,查看联赛排名并将记录发送到我
的
代码,我想这是可能
的
。我知道有些网站有你可以使用
的
API,但我会使用它
的
网站没有…
浏览 1
提问于2016-07-07
得票数 0
1
回答
python
中
的
嵌套隐藏标记
抓取
、
、
、
第一件事首先,对
python
和
web
抓取
来说非常新。 我有一页书需要刮掉。我看了很多源,却找不出嵌套隐藏标记
的
抓取
方法。该页面需要登录并能够获取可见数据,我
的
代码成功地执行了这些数据。但是,当涉及到在div标记中刮取嵌套
元素
时,它什么也找不到。我
的
问题是访问最
内部
的
span中
的
文本。1" menuname="Cancel" parentid="63"
浏览 0
提问于2019-03-01
得票数 1
1
回答
从网页中
提取
主题/关键字
、
、
我正在寻找一个系统,以
提取
主题或简单
的
关键字从一个网页,只有从指定
的
网页,没有跟随所包含
的
链接。要分析
的
页面属于不同
的
站点,特别是我想分析一个人在Facebook上共享
的
链接,并从这些页面中
提取
主题或简单
的
关键字。非常感谢。
浏览 5
提问于2014-04-11
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券