腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Python
text
抓取
网站
中
的
“
下一
段
”
文本
、
我正在创建一个
python
程序,从
网站
上
抓取
公司财务。我意识到,包含这些信息
的
网站
特别难以可靠地收集数据,因此,我遇到了一个障碍。https://www.reuters.com/companies/3in.L/key-metrics 从这个
网站
上,我试图刮掉
文本
“股本回报率(TTM)”旁边
的
值。(目前为8.86) 我已经搜索过StackOverflow和很多其他
网站
了。(page.co
浏览 23
提问于2021-01-04
得票数 0
2
回答
使用
python
将内容写入
文本
文件,使用java清除同一
文本
文件
中
的
内容。
、
、
、
我已经写了一个
python
脚本转到一个
网站
,从
网站
上
抓取
一些
文本
,并将这些
文本
保存到我
的
计算机上
的
文本
文件
中
import os chrome_path但是当我尝试将
python
脚本集成到java程序
中
(下面的代码)时,从
网站
上
抓取
的
文本
没有写入到
浏览 26
提问于2020-03-08
得票数 0
1
回答
Python
Chrome驱动程序单击Safari Web浏览器上
的
Reader视图
、
、
、
抓取
网站
时,如何在Safari浏览器
中
单击"Reader View“?我需要一个
python
脚本来点击阅读器视图,然后复制所有内容到一个
文本
文件。请看我当前代码
的
一小
段
: driver = webdriver.Chrome('/usr/local/bin/chromedriverhttps://www.w3r
浏览 4
提问于2020-05-14
得票数 0
1
回答
jsoup选择元素
、
、
我正在尝试用jsoup
抓取
网站
上
的
数据。但是在获取一些
文本
时遇到了一些问题。html
的
一部分如下所示我可以使用下面这行代码很好地
抓取
它:doc.select("p.time").
text
()); 但是
下一
段
html看起来像这样:
浏览 2
提问于2012-07-02
得票数 0
1
回答
如何使用
Python
从
网站
上
抓取
文本
、
、
、
、
我用
python
编写了一
段
代码,使用“请求”和“beautifulSoup”api从谷歌返回
的
前100个站点中
抓取
文本
数据。好吧,它在大多数站点上都很好,但是它给那些稍后响应或者根本没有响应
的
站点带来了错误,我得到了这个错误。fair-with-a-flare-samosas-made-easy (由NewConnectionError引起(‘:未能建立新连接: Errno 11001 getaddrinfo失败“,) 我应该修改在请求API
中
编写
的
代
浏览 1
提问于2016-01-02
得票数 2
回答已采纳
2
回答
Python
-如何在URL
中
不分页地刮分页
、
如何使用URL访问
下一
页,内容如下:我知道如何使用刮取库(BS4、Selenium),但我不知道如何
抓取
这样
的
站点。我一直在玩谷歌Chrome开发工具,但没有成功。我知道pubmed有API,但是API不返回我需要
的
信息(天气文章是否可以免费下载)。像
Python
这样
的
抓取
站点通常
的
工作流程是什么?
浏览 0
提问于2019-07-05
得票数 0
回答已采纳
1
回答
当
下一
页
的
后续链接在当前页面源代码
中
不可用时,
抓取
网站
的
所有页面
、
嗨,我已经成功地通过使用
Python
和正则表达式
抓取
了一些购物
网站
的
所有页面。但现在我遇到了麻烦,要
抓取
某个特定
网站
的
所有页面,该
网站
的
下一
页后续链接不存在于当前页面
中
,就像这里
的
本
网站
通过Ajax调用动态加载同一页面
中
的
下一
页数据。所以在
抓取
的
时候,我只能
抓取</
浏览 0
提问于2013-05-28
得票数 0
1
回答
绕过API身份验证和密钥(比如Facebook和Twitter)
、
、
、
我试着用
Python
制作一种机器人,在我选择
的
互联网上扫描一些信息。问题是,一些像Facebook和Twitter这样
的
网站
在每次使用时都会获得API要求
的
密钥。例如,在没有用
Python
验证我
的
请求
的
奇怪键
的
情况下,如何才能找到Twitter
的
研究结果?有可能吗?
浏览 2
提问于2014-01-28
得票数 1
回答已采纳
1
回答
Web通过
python
抓取
问题,不能读取html文件吗?
、
、
web
抓取
Python
已经有一
段
时间了,最近我遇到了这个问题。BeautifulSoup似乎无法读取html文件。例如,我正试着从这个
网站
上
抓取
from bs4 import BeautifulSoupurl_episode = 'https://www.thetvdb.comurl_episode) soup = BeautifulSoup(getdetail_episode.content,'h
浏览 1
提问于2020-04-06
得票数 0
1
回答
将数据从HTML
文本
输入传递到
python
脚本
、
、
、
、
我正在创建一个网络
抓取
应用程序,使用Django,它
抓取
imdb
网站
,并根据用户在
文本
字段中键入
的
内容列出电影名称假设如果用户键入'b',它将列出所有以字母'b‘开头
的
电影名称我有一个html
文本
输入和一个按钮<body> <form method="POST" action=""&
浏览 1
提问于2018-01-11
得票数 4
1
回答
如何与soup.find()进行部分匹配?
、
、
、
、
所以,我用这个在“维度”之后
抓取
文本
。我
的
问题是在我正在
抓取
的
网站
上,有时它被显示为“维度:”(用冒号),有时它有空格“维度”,而我
的
代码会抛出一个错误。这就是为什么我要寻找smth (显然,这是一
段
无效
的
代码)来获得部分匹配: soup.find(if "Dimensions
浏览 8
提问于2022-02-21
得票数 0
回答已采纳
3
回答
Python
web
抓取
用户列表
、
我试图从一个
网站
上
抓取
用户列表,但它有多个页面,我可以
抓取
第一个页面,但当我
抓取
每个页面时就卡住了。page=1').
text
在url
中
的
通知好
的
,
下一</
浏览 5
提问于2018-01-09
得票数 1
回答已采纳
1
回答
抓取
文本
;我不确定Google Chrome Inspect元素是否给了我正确
的
XPath。我在哪里可以找到正确
的
路径?
、
、
、
、
在这里,我想
抓取
一个名为“fundsnetservices.com”
的
网站
。具体地说,我想要
抓取
每个程序下面的
文本
-它大约是一
段
文本
的
价值。'/html/body/div3/div/div/div1/div/p2/
text
()‘ ..。作为xpath。但是,每次我打印出
文本
时,它都会返回。为什么会这样呢?searchr
浏览 0
提问于2020-04-02
得票数 0
1
回答
从网页中提取主题/关键字
、
、
我正在寻找一个系统,以提取主题或简单
的
关键字从一个网页,只有从指定
的
网页,没有跟随所包含
的
链接。要分析
的
页面属于不同
的
站点,特别是我想分析一个人在Facebook上共享
的
链接,并从这些页面中提取主题或简单
的
关键字。非常感谢。
浏览 5
提问于2014-04-11
得票数 0
2
回答
Python
web
抓取
,使用html请求查找特定元素并提取
文本
、
、
、
我正在使用
python
进行网络
抓取
(这是新
的
),并试图从
网站
上
抓取
品牌名称。它在
网站
上不可见,但我已经找到了它
的
元素:我想提取HTML
中
的
"Revlon“
文本
我目前正在使用html请求,并尝试获取选择器(CSS)和<
浏览 0
提问于2021-04-15
得票数 0
1
回答
python
:'NoneType‘对象没有属性'
text
’
、
、
、
我正在用漂亮
的
汤做
python
抓取
,我正在爬行
的
网站
有一个包含标题、链接和
文本
的
28个容器,
文本
在<p>标签
中
,我
的
问题是我可以
抓取
所有的数据,但是有些<p>标记没有
文本
,所以我收到一个错误"AttributeError: 'NoneType' object has no attribute '
text</em
浏览 0
提问于2018-05-20
得票数 0
回答已采纳
1
回答
Python
-如何测试字符串之间
的
相似性并仅打印新字符串?
、
、
、
、
我已经开发了一种带有漂亮汤
的
网络摩天大楼,它可以从
网站
上
抓取
新闻,然后将它们发送给电报机器人。每次程序运行时,它都会拾取当前新闻网页上
的
所有新闻,我希望它只挑选新闻上
的
新条目,并只发送这些条目。import bs4 soup = bs4.BeautifulSoup(fonte.
text
, 'lxml')
浏览 0
提问于2018-05-18
得票数 1
1
回答
使用XPath获取包含链接
的
段落
文本
、
我正在用XPath解析超
文本
标记语言页面,想要
抓取
一些特定段落
的
整个
文本
,包括链接
的
文本
。例如,我有以
下一
段
话: This is sample paragraph with <a href="http://google.com">link</p> 我需要得到以下
文本
作为结果
浏览 0
提问于2011-11-09
得票数 5
回答已采纳
1
回答
阻止在
python
中
从
网站
抓取
数据
、
、
、
、
我对网络
抓取
和构建爬虫是个新手,我开始在一个杂货
网站
上练习。我已经尝试从一个
网站
抓取
数据很长一
段
时间了,不能超过三个页面,对于前三个页面,
网站
让我访问数据,但在那之后我没有得到任何响应,甚至在几秒钟内我也无法在浏览器上获得响应。
网站
使用API来获取所有的数据,所以我甚至不能使用BeautifulSoup,我想使用selenium,但也没有运气。我使用
python
的
请求库来获取数据,并使用json进行解析。该
网站
需要p
浏览 1
提问于2020-04-15
得票数 0
1
回答
从
网站
中
抓取
字符串
中
的
单词
、
、
我对scrapy和
Python
非常陌生。我正在制作一个网络刮板,试图从他们
网站
的
HTML
文本
中
刮掉企业主
的
名字。我
的
问题是,我不能准确地使用xpath或css响应来从
网站
代码
中
获取
文本
,因为我正在
抓取
数百个具有不同编码、类、页面等
的
不同
网站
。html_
text
= str(response.
text
) owner_name=re
浏览 25
提问于2020-06-09
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
网站抓取引子-获得网页中的表格
java基础,前端开发中不可缺少的知识,text文本属性,代码写法!
Python爬虫学习:抓取电影网站内容的爬虫
Python多进程方式抓取基金网站内容的方法分析
Python实例分析(一)删除文本中的空行
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券