腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
urllib
时
,
无法
获取
java
脚本
标记
后
的
文本
、
、
我正在尝试
使用
urllib
获取
html页面。但是在
使用
urllib
请求url
时
不提取端口。预期结果应与上述结果相同。在实际结果中,我没有在
java
脚本<
浏览 20
提问于2019-07-26
得票数 0
2
回答
使用
BeautifulSoup get_text或findAll(text=True)
时
无法
获得可见
文本
、
、
我正在尝试
使用
bs4和python3.4.1从网页中提取可见
文本
。为此,我从汤中提取所有
脚本
和样式元素,然后继续从剩余
的
html中
获取
文本
。 为了测试目的,我
使用
x,y,z来观察我对汤
的
修改。html =
urllib
.request.urlopen('http://www.skilledup.com/articles/reasons-to-learn-python').re
浏览 5
提问于2016-02-04
得票数 0
回答已采纳
1
回答
使用
Scrapy 'regex定义‘
、
、
我一直试图生成一个
脚本
,从网站中抓取数据。我生成了一个pythonscrapy2.7
脚本
来从网站上
获取
一段
文本
(我目前
的
目标是什么),但似乎
无法
让它发挥作用。我怀疑这是因为我没有正确地配置我
的
regex来识别我试图从其中提取
的
span
标记
。有没有人知道我可能做错了什么,我是怎么解决
的
?import re url = "https:/
浏览 8
提问于2016-05-02
得票数 3
回答已采纳
1
回答
从给定
的
URL提取CSS/JSS
、
、
当前正在尝试编写一个python
脚本
,该
脚本
可以从给定
的
URL提取CSS/JSS。偶然发现了
urllib
3,它帮助我在PoolManager()实用程序
的
帮助下收集了给定网址
的
超
文本
标记
语言。
使用
下面的简短代码,我能够提取给定URL
的
HTML,然后将其存储在一个文件中。import
urllib
3x = http
浏览 1
提问于2015-06-18
得票数 0
1
回答
如何
使用
Python
获取
脚本
中
的
JSON数据
、
、
我正在尝试
获取
在检查特定URL
的
页面源代码
时
看到
的
JSON数据。这个URL有多个
标记
,但是其中只有一个
标记
包含JSON格式
的
数据。下面是我目前
的
实现:from bs4 import BeautifulSoupimport json page =
urllib<
浏览 0
提问于2018-10-26
得票数 0
2
回答
通过python加载网站内容
、
例如,我想加载博客
的
一些帖子并将它们显示在我自己
的
site.How中。我可以这样做吗?
浏览 2
提问于2011-03-25
得票数 1
1
回答
如何在调用堆栈api而不是'application/ json‘
时
获取
json数据
的
纯
文本
?
、
、
如何以json数据
的
纯
文本
形式
获取
堆栈api
的
响应,而不是响应application/json,因为第一种响应方式可以由程序直接处理。
浏览 0
提问于2010-12-16
得票数 0
2
回答
使用
BeautifulSoup从html中提取
文本
,但
脚本
标记
的
内容除外
、
、
、
getCurrentLocationVal("loc_loads1",29.45218856,59.38139268,1);</span>所以我编写了python代码如下from bs4 import BeautifulSoup as bs http =
urllib
3.PoolManage
浏览 0
提问于2018-12-10
得票数 3
回答已采纳
2
回答
Python抓取
、
、
、
、
嗨,我对python和web都很陌生,下面是我从网站
获取
URL
的
脚本
,但是我被夹在中间,我
无法
从类
标记
中获得URL,如果我查看了这个网站,我可以看到,但是在我
的
脚本
中,它显示为javascript,任何帮助,请提前感谢import
urllib
.requesturl = "https://www.northcoastel
浏览 3
提问于2017-09-20
得票数 1
回答已采纳
2
回答
Python抓取包含PHP
的
页面源代码
、
我知道如何抓取源代码HTML,但不知道PHP,有没有可能用内置
的
函数?
浏览 0
提问于2013-02-25
得票数 0
回答已采纳
3
回答
Python读取http:在浏览器中看到
的
html页面-带有javascripts结果
、
、
在javascripts运行
后
,我可以在浏览器中看到完全格式
的
http页面吗?不需要提交数据并按下按钮。我
的
标准任务是,在哪里可以看到运行所有
脚本
并得到结果
的
示例?通过:data = u.read() 如果我选择在浏览器中查看源代码,我会看到页面。然而,当我检查页面上
的
元素
时
,我看到代码是如何扩展
的
,例如:
浏览 0
提问于2016-05-24
得票数 0
1
回答
如何修复‘ValueError(“输入必须有多个句子”)’错误
、
、
我正在写一个
脚本
,需要一个网站
的
网址,并
使用
美丽
的
汤下载它。然后它
使用
gensim.summarization来总结
文本
,但是我一直得到ValueError(“输入必须有多个句子”),即使
文本
有多个句子。
脚本
的
第一部分下载
文本
,但我
无法
获得第二部分来总结
文本
。========================================== file.write
浏览 12
提问于2019-02-07
得票数 2
1
回答
urllib
:
获取
utf-8编码站点源代码
、
、
、
我正在尝试
获取
某个网站
的
一部分。
脚本
可以工作,但是它是一个带有a,é,í,ó,u等重音
的
网站。当我
使用
urllib
或
urllib
2
获取
站点
时
,站点源代码不是以utf-8编码
的
,因为utf-8支持这些重音。>opener =
urllib
2.build_opener() opener.addheaders = [('Acce
浏览 0
提问于2012-04-07
得票数 2
回答已采纳
3
回答
无法
在BeautifulSoup中美化抓取
的
html
、
、
、
我有一个小
脚本
,它
使用
urllib
2来
获取
站点
的
内容,找到所有的链接
标记
,在顶部和底部附加一小段超
文本
标记
语言,然后我尝试美化它。import
urllib
2import re pre= '<html><head>
浏览 0
提问于2010-01-08
得票数 2
回答已采纳
2
回答
BeautifulSoup findAll在选择类
时
返回空列表
、
、
、
findall()在指定class
时
返回空列表 指定
标记
可以正常工作 import
urllib
2req =
urllib
2.Request(url, headers=hdr) htmlpage=
urll
浏览 3
提问于2019-04-23
得票数 1
1
回答
BeautifulSoup python引发errno22错误无效模式('r')
、
、
、
、
我正在尝试用python编写一个从特定站点下载图像
的
图像归档程序,但我总是得到一个ioerror errno22无效模式('r')或出现在我漂亮
的
汤行上
的
文件名错误。: imageList.append(randomTag) url本身是有效
的
,
浏览 1
提问于2013-04-02
得票数 0
回答已采纳
2
回答
我似乎不能将变量
的
值与innerHTML放在一起
、
我
的
js
脚本
:var dd = String(today.getDate()).padStart(2, '0'); 我
的
浏览 9
提问于2022-01-04
得票数 -2
回答已采纳
2
回答
无法
读取所有HTML (Web抓取)
、
、
、
、
我试图
使用
BeautifulSoup和requests库从一个以超
文本
标记
语言表示
的
表中抓取数据,但我
无法
获得所有的超
文本
标记
语言代码。from
urllib
.error import URLError, HTTPError url = 'httpsRequest(url,
浏览 4
提问于2020-10-16
得票数 0
2
回答
从URL解析XML并从标签
获取
信息
、
、
、
、
我尝试
使用
python从XML
的
" CRS“
标记
中
获取
信息,并收集所有的CRS
标记
,或者稍后我将编辑代码以检查特定
的
CRS。service=WMS&request=GetCapabilities 我可以
获取
数据,但我不知道如何从正确
的
标签中
获取
信息。这是我到目前为止
的
代码: import
urllib
.request,
urllib
.parse,
urll
浏览 27
提问于2021-01-19
得票数 0
2
回答
为什么这个Jython循环在一次运行
后
就失败了?
、
、
、
、
它给了我我想要
的
输出,它是来自http请求
的
数据,它写在我
的
Versions.py文件中,上面的
java
代码调用了该文件。第二次之后,它抛出了这个巨大
的
错误( 950行长,当然,我不会折磨你们)。
java
.util.concurrent.RejectedExecutionException: event executor terminatedha
浏览 8
提问于2015-08-27
得票数 15
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Java调用Shell脚本时的死锁陷阱
一直说爬虫,你可知道爬虫的机制内容的嘛?
解决问题的过程
用python3教你任意Html主内容提取
BeautifulSoup解析库select方法实例——获取企业信息
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券