腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
JS
函数
的
python
html
抓取
结果
、
、
、
我正在尝试
抓取
一个在其上执行
JS
脚本
的
网页。我可以使用from requests import get获得未执行
JS
的
超文本标记语言 但是我不能让
JS
函数
产生像我用mozilla检查网页那样
的
结果
下面是我想要获得
结果
的
函数
: functionpycurl.WRITEFUNCTION, e.write) return e 或 respo
浏览 32
提问于2020-04-07
得票数 0
回答已采纳
1
回答
返回充满变量
的
HTML
的
漂亮汤
、
当我将链接粘贴到浏览器中并检查
html
代码时,它看起来是标准
的
,并且我能够轻松地识别出我正在搜索
的
元素(见下文)。但是,当我运行
python
代码并使用漂亮
的
方法获取
HTML
时,返回
的
HTML
看起来与浏览器
的
inspect元素视图中
的
外观完全不同。
HTML
不是普通
的
标签,而是充满了变量,基本上看起来像我以前见过
的
任何东西(我没有做过大量
的
抓
浏览 0
提问于2019-08-04
得票数 2
2
回答
在
python
中获取详细信息时在bs4中出错
、
我正在使用
python
和bs4来
抓取
github数据,我想使用这个
函数
来
抓取
用户
的
星级数据。def total_stars(username):
html
= requests.get('https://github.com/'+username).textsoup = BeautifulSoup(
html
, '
html
.parser')
浏览 28
提问于2021-11-23
得票数 0
1
回答
如何使用beautifulSoup对堆栈溢出问题进行web
抓取
标记?
、
= link.get('href') for i in link: title = link.string print(title) 输出:
python
浮点舍入
python
非谷歌合作
python
flask
python
漂亮汤
python
nonetype
python
ubuntu等。在从堆栈溢出站点提取数据时,我们在
抓取
问题
的
标签时遇到了问题。我们可以
抓取</em
浏览 0
提问于2018-03-17
得票数 0
1
回答
python
没有错误,但我
的
抓取
器返回空白
、
我已经尝试了几个小时来查找和测试不同
的
东西,但仍然一无所获。当我运行产品信息和获取页面时,它们单独工作很好,但我
的
main
函数
不会返回任何信息。url) for url in urls] return results 这就是我不断得到
的
回报
浏览 0
提问于2021-05-19
得票数 0
3
回答
Python
HTMl
抓取
不会产生
结果
、
、
、
、
(
Python
新手入门和第一篇文章)有没有人知道这是不是我
的
代码出了问题,或者网站结构有没有我没考虑到
的
地方?import requests page = requests
浏览 2
提问于2017-03-20
得票数 0
2
回答
如何在javascript中运行
python
脚本
、
中使用
python
我想做一个活
的
网络刮刀。
Python
是最好
的
网络
抓取
工具。但我正试图在前端运行
Python
代码。所以我
的
应用程序
的
性能很好。
浏览 3
提问于2022-05-08
得票数 -1
1
回答
在中,如何处理“陈旧元素引用:元素没有附加到页面文档”中
的
致命错误?
、
、
我需要阅读从低温货币市场
的
要价/出价。但是,当市场过于拥挤时,就会出现“陈腐元素错误”。presenceOfAllElementsLocatedBy(WebDriverBy::xpath("//tr[@class='price-level']//td[@class='bid-price']"))); 第一个问题是,我是否以正确
的
方式获得这些快速变化
的
数据第二个问题是,为什么当我使用下面的代码来避免致命错误时,什么都没有发生,致命<e
浏览 5
提问于2019-07-14
得票数 1
回答已采纳
1
回答
Selenium不工作在服务器上,因为它在本地机器上工作。
、
、
、
我最近完成了Selenium
Python
刮板。当我在我
的
个人机器上运行它时,它运行
的
非常好,但是当我在服务器上运行它时,
结果
是不一样
的
。browser.get('https://example.com') 这是我
的
pyvirtualdisplay代码。display = Display(visible=0, size=(800, 600)) display.start()
浏览 5
提问于2016-06-15
得票数 3
1
回答
无法
抓取
非
html
元素
、
、
我正在尝试从许多网站上
抓取
搜索
结果
。问题是,并不是所有这些网站都以纯
html
文本
的
形式返回搜索
结果
,其中很多都是用
JS
、AJAX等动态生成
的
。然而,我可以通过使用Firefox检查器查看页面来确切地看到我需要
的
内容,因为脚本都已经运行并修改了
html
。作为参考,我使用
浏览 0
提问于2015-03-13
得票数 0
1
回答
分页,而不对每个页面有不同
的
urls。
、
、
、
我正在
抓取
一个web (使用
Python
请求和请求-
html
模块),我需要浏览项目列表
的
所有页面。 在“人工用户”世界中,我单击"2“表示第二页,或在"->”中单击从实际到下一页。我尝试过执行请求-
HTML
文档所建议
的
for循环分页,但是在本例中它不起作用,因为没有与r.
html
对象相关
的
链接,也没有与列表
的
每个页面相关联
的
链接。当我点击,在网站上,在那些“div”
的
网址根
浏览 3
提问于2019-05-01
得票数 0
回答已采纳
1
回答
绕过API身份验证和密钥(比如Facebook和Twitter)
、
、
、
我试着用
Python
制作一种机器人,在我选择
的
互联网上扫描一些信息。问题是,一些像Facebook和Twitter这样
的
网站在每次使用时都会获得API要求
的
密钥。例如,在没有用
Python
验证我
的
请求
的
奇怪键
的
情况下,如何才能找到Twitter
的
研究
结果
?有可能吗?
浏览 2
提问于2014-01-28
得票数 1
回答已采纳
4
回答
如何从外部网站获取
HTML
表值?
、
、
、
我想要访问一些
HTML
表数据,以便保存和脱机使用它们。目前,当我下载网页并将JavaScript放入该文件时,我使用
的
是JavaScript,它可以正常工作。但是我想直接从网页中获取元素,而不需要下载之前
的
内容,或者让JavaScript自动下载并从下载
的
文件中获取元素。 这有可能吗?我找不到答案,因为每个人都要求自己
的
网页,但我没有自己
的
网站,我想从那里获得表格数据。info.innerHTML = info.innerHTML + ' ' + objCells.i
浏览 32
提问于2019-02-23
得票数 0
2
回答
Python
3网络
抓取
问题(关于
JS
)
、
、
我很纠结于尝试
抓取
一个网站(使用
Python
/Selenium),其中包含部分
JS
构建
的
链接和内容。在我
的
例子中,我想要获取
的
链接如下:{{link_ID}}def URL_from_
JS
(URL): print(new_URL) #f
浏览 2
提问于2016-04-12
得票数 2
3
回答
使用Selenium
抓取
id_str对象
、
、
、
使用
python
中
的
Selenium库,我目前正在从twitter搜索
结果
页面( )中
抓取
内容。由于每个元素
的
长度,我不会在这里直接复制所有的
html
代码,但是我注意到所有的id_str前面都有: origina
浏览 0
提问于2018-12-04
得票数 2
回答已采纳
1
回答
我需要一些帮助来启动一个
html
解析项目。
、
、
、
归根结底,我有一堆需要解析各种信息
的
html
文件。这些文件是从在线论坛上归档
的
。我基本上想要做
的
是能够为程序提供一个
html
文件,并让它将以下信息写入数据库:以及其他一些类似的信息。
HTML
解析器会是未来
的
发展方向吗?我看过它,但老实说,我不太了解如何实现它。我有计算机科学
的
学士学位,但它
的
浏览 0
提问于2013-06-03
得票数 0
1
回答
在
python
中浏览/解析
html
页面
、
、
、
、
为了与
html
页面进行交互,我试图把一些我需要
的
插件集合在一起。我需要
的
范围从简单
的
浏览和与按钮或网页链接(如“在这个文本框中写一些文本并按这个按钮”)进行交互,到解析
html
页面和向服务器发送自定义get/post消息。我正在使用
Python
3,到目前为止,我有Request用于简单
的
网页加载、自定义get和post消息,BeautifulSoup用于解析
HTML
树,我正在考虑尝试机械化来进行简单
的
网页交互。还有其他类似于
浏览 3
提问于2014-04-17
得票数 1
回答已采纳
2
回答
搜索爬行“机器人”?
、
、
、
我正在从事一个项目,需要我收集有关某些主题
的
网站
的
网址大列表。我想写一个脚本,将使用谷歌搜索特定
的
词语,然后保存
的
网址从
结果
到一个文件。我该怎么做呢?我使用了一个名为xgoogle
的
模块,但它总是不返回任何
结果
。 我在Windows7上使用
Python
2.6。
浏览 0
提问于2010-09-17
得票数 0
回答已采纳
3
回答
如何在javascript中返回搜索
结果
(使用
python
)
、
、
我想要刮
的
站点使用JavaScript填充返回。返回
的
来源很简单<?> <head> <SCRIPT typ
浏览 0
提问于2014-03-25
得票数 2
回答已采纳
1
回答
在
Python
中爬行网页并调用javascript
函数
、
、
、
、
我需要
抓取
一个网站,然而,它
的
内容是动态
的
。
Python
中有没有可以调用
js
函数
的
包?例如,假设我在
JS
中有一个链接和
JS
函数
1、2和3,我应该在该网页上调用,并且在所有
JS
函数
调用之后我需要最终
的
网页。
浏览 16
提问于2019-02-12
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券