为什么我代码中的html.fromstring不工作？_为什么我的代码不工作(java netbeans)？_为什么我的超参数代码不工作？ - 腾讯云开发者社区

、、、

因此，我试图从这个网站中删除这份工作。我有以下代码： url = "https://www.dsdambuster.com/careers" page = requests.get(url, verify=False) tree = html.fromstring(page.content) path = '/html/body/div[1]/section/div/div/div[2]/div[1]/div/div[2]/div/div[9]/div[1]/div[3]/div[*]/div[1]/a[*]/div/div[1]/div' jobs =

浏览 1提问于2022-03-06得票数 0

1回答

python: xpath从boxofficemojo.com返回空列表

、

我试图使用下面的代码从BoxOfficeMojo.com上的每一部电影的页面中抓取特定的数据。不幸的是，xpath返回一个空列表。有些帖子建议从xpath中删除tbody，但这也会返回一个空列表。我使用了相同的代码从Rotten番茄和IMBD中提取文本，xpath工作得很好。有没有人知道为什么会发生这种情况，以及如何解决这个问题？ from lxml import html import requests # Box Office Mojo Scrape page = requests.get('http://www.boxofficemojo.com/movies/?page=ma

浏览 2提问于2016-01-20得票数 1

回答已采纳

1回答

使用Xpath从网页获取字符串

、、、

我正在尝试从这个网页获得uniprot：。但我在使用xpath时遇到了问题。现在，我得到了一个空的名单，我不明白为什么。我的想法是编写一个接受ENSEMBL ID并返回uniprot的小函数。 import requests from lxml import html ens_code = 'ENST00000378404' webpage = 'http://www.ensembl.org/id/'+ens_code response = requests.get(webpage) tree = html.fromstring(response.conte

浏览 3提问于2016-04-07得票数 2

回答已采纳

2回答

刮板送毛坯输出

、、、

我在python脚本中使用了一个选择器来从下面给出的一些html元素中获取文本。我尝试使用.text从元素中获取Shop here cheap字符串，但它根本不起作用。但是，当我尝试使用.text_content()时，它可以正常工作。我的问题是： .text方法有什么问题？为什么不能解析元素中的文本呢？ Html元素： <div class="Price__container"> <span class="ProductPrice" itemprop="price">$6.35</span>

浏览 4提问于2017-10-23得票数 1

回答已采纳

1回答

用于Yahoo！的HTML抓取器使用lxml和请求返回错误值的财务

、、、

from lxml import html import requests page = requests.get('https://finance.yahoo.com/quote/AMZN?p=AMZN&.tsrc=fin-srch') tree = html.fromstring(page.content) peRatio = tree.xpath('//span[@class="Trsdu(0.3s) "] [@data-reactid="92"]/text()') peRatio 如果我写了@data-rea

浏览 17提问于2019-02-28得票数 1

回答已采纳

2回答

python tree.xpath返回空列表

、、

我很难弄清楚为什么下面代码中显示的tree.xpath方法会返回一个空列表。在这个例子中，我只是试图检索雅虎财务中的"People也Watch“横幅下的股票代码，这看起来很琐碎，但到目前为止还无法让它正常工作。我正在从inspect元素页面复制xpath。还尝试手动更改xpath，例如删除“tbody”，但两者都没有工作。任何帮助都会很感激的。谢谢 import requests from lxml import html ticker = 'TSLA' url = 'https://finance.yahoo.com/quote/'+str(ti

浏览 1提问于2020-01-16得票数 0

回答已采纳

2回答

Python不是xpath中的信息

、、

无论如何，我正在尝试为我正在开发的机器人爬行一个网站；我对xpath不太熟悉，现在我可以获得一些信息，但是从我正在爬行的网站上可以得到一些指南(比如游戏指南)(这是一个游戏)，我想获得指南的标题，但它没有输出任何内容；我将解释我的代码： name = input("> ") page = requests.get("http://www.mobafire.com/league-of-legends/champions") tree = html.fromstring(page.content) for index, champ in enumerate

浏览 1提问于2016-11-26得票数 0

回答已采纳

1回答

解析本地HTML python (lxml)

、、

我正在尝试用lxml解析本地HTML，但是我得到了一个错误，但我不知道为什么(对错误的代码表示歉意，我是新手)。 from lxml import etree, html from StringIO import StringIO parser = etree.HTMLParser() doc = etree.parse(StringIO("test1.html"), parser) tree = html.fromstring(doc) CCE = tree.xpath('//div[@data-reactid]/div[@class="browse-sum

浏览 7提问于2016-01-25得票数 4

回答已采纳

1回答

Python XPATH不返回任何数据

、、

试图从列表中抓取数据，但出于某种原因，它返回为空。类似的代码已经在其他网站工作，我很困惑为什么它不会在这个网站上。请帮帮我！ import requests from lxml import html start_url ="https://www.anybusiness.com.au/search?page=1&sort=date-new-old" res = requests.get(start_url) tree = html.fromstring(res.content) # Retrieve listing title title_xpath =

浏览 2提问于2021-07-09得票数 0

回答已采纳

0回答

在Amazon上使用Selenium

、、

我不明白为什么selenium不把我的数据输入到amazon search中。我知道它会打开亚马逊的chrome浏览器，但它不会显示在搜索栏中。你知道我的代码出了什么问题吗 from lxml import html, etree import csv,os,json import requests from time import sleep from selenium import webdriver textsearch = "Taco Bell Sauce" browser = webdriver.Chrome('/home/path/Documen

浏览 1提问于2017-11-25得票数 0

3回答

在带有lxml的Xpath中没有任何元素: Javascript生成的页面

、、

我以前也做过Xpath工作，在Chrome浏览器中，我可以在控制台中找到我的xpath，$x('//*@id="profile"/div2/div2/div1/div2/div2/div1/span2)在上使用。当我试图在代码中得到这个元素时，它会返回一个空数组，有人知道为什么吗？ @client.command(pass_context=True) async def checkChrisPubg(ctx): page = requests.get('https://pubgtracker.com/profile/pc/Fuzzyllama/duo?

浏览 0提问于2018-05-09得票数 5

回答已采纳

1回答

运行Python脚本从CNN抓取新闻报道时没有输出

import requests from lxml import html page = requests.get('http://www.cnn.com') html_content = html.fromstring(page.content) for i in html_content.iterchildren(): print i news_stories = html_content.xpath('//h2[@data-analytics]/a/span/text()') news_links = html_content.xpath(&

浏览 7提问于2016-12-04得票数 1

回答已采纳

1回答

Python到CSV或Excel导出多个数据

、、

嘿，伙计们，我试着把数据写入csv文件/ excel。问题是Excel文件我不能让它工作，而csv只显示“元素div at xx.xxx.xx”等等。我不想一行行地把产品和价格填写到正确的匹配位置。擅长者优先。大约1000种产品将被报废。标准代码测试代码是否有效： from lxml import html import requests urls = ['http://whiskey.de/shop/Aktuell/'] for url in urls: for number in range(1, 15): page_url = url +

浏览 2提问于2015-06-10得票数 0

回答已采纳

3回答

Python:在不退出驱动程序的情况下，对多个URL使用Selenium

、、

我正在尝试使用Selenium来刮掉一些URL。下面是代码的一部分： driver = webdriver.Chrome() url = 'first URL' driver.execute_script('''window.open("'''+str(url)+'''","_blank");''') driver.switch_to_window(driver.window_handles[1]) time.sleep(3) doc1 = html.

浏览 0提问于2019-03-02得票数 1

回答已采纳

2回答

如何使用Python从网页获取信息？

、

我在简单的xpath中遇到了这个问题，我不知道为什么它不能工作。我从一个工作函数中复制了这个函数，我真的不知道为什么这个函数不能工作。我阅读了几个教程，并在另一个脚本中有了一个工作函数，但是这个函数不符合我的要求。它应该从网页中得到一些字符串，但我只得到了空变量。 def getWeather(): try: page = requests.get('https://www.google.com/search?q=wetter&oq=wetter&ie=UTF-8') except: print('URL not reachab

浏览 3提问于2020-05-14得票数 1

回答已采纳

1回答

使用Xpath进行数据抓取不返回任何值

、、

我想从以下网站刮掉一个项目承诺的金额，我使用相同的方法，但对于一个网站的代码没有返回任何值。这段代码的输出是一个空数组： import urllib import requests from lxml import html url = 'https://www.kickstarter.com/projects/scratchideas/loki-the-ultra-portable-modular-and-robust-camera?ref=category' page = requests.get(url=url) tree = html.fromstring(page

浏览 21提问于2020-04-14得票数 0

回答已采纳

3回答

URLRetrieve错误处理

、、

我有下面的代码，它使用urlretrieve working来捕获图像。说得太对了。 def Opt3(): global conn curs = conn.cursor() results = curs.execute("SELECT stock_code FROM COMPANY") for row in results: #for image_name in list_of_image_names: page = requests.get('url?prodid=' + row[0])

浏览 2提问于2014-07-12得票数 1

回答已采纳

2回答

为什么我代码中的html.fromstring不工作？

、

我在下面的代码中使用了html.fromstring： import html import sys url = "https://tokcount.com/?user=totallynotbenandoliver" response = requests.get(url) try: response = requests.get(url) except: print ('Sorry bad url') sys.exit(2) if response.status_code != 200: print ('Sorry invalid

浏览 74提问于2021-08-16得票数 1

回答已采纳

3回答

XPath:选择值为空的标签

、、、

如何在XPath 1.0中查找col name="POW"为空的所有行 <row> <col name="WOJ">02</col> <col name="POW"/> <col name="GMI"/> <col name="RODZ"/> <col name="NAZWA">DOLNOŚLĄSKIE</col> <col name="NAZDOD">województwo&

浏览 1提问于2011-12-31得票数 10

回答已采纳

1回答

Python 3.4 : LXML web抓取

、

我正在使用下面的代码试图返回一个在该网站上的代码列表。代码的结果是一个空列表。我从工具中复制xpath。我做错了什么？ from lxml import html import requests url = 'http://en.wikipedia.org/wiki/List_of_S%26P_500_companies' resp = requests.get(url) tree = html.fromstring(resp.text) tickers = tree.xpath(r'//*[@id="mw-content-text"]/tabl

浏览 3提问于2015-06-09得票数 1

回答已采纳

1回答

用python中的lxml和请求包解析xml和html页面

、、、、

我一直试图在python中使用lxml和requests来解析xml和html页面。为此，我使用了以下代码：在python中： import requests import lxml.etree url = "" req = requests.get(url) tree = html.fromstring(req.content) root = tree.xpath('') for item in root: print(item.text) 此代码工作正常，但对于某些网页无法正确显示其内容，需要设置编码utf-8，但我不知道如何在此代码中添加set

浏览 10提问于2016-11-06得票数 3

2回答

简单的python web抓取

、、、、

我有下面的python代码 from lxml import html import requests url = 'https://www.url.com/?q=715/6+3 TI' page = requests.get(url).text.encode('utf-8').strip() tree = html.fromstring(page) price = tree.xpath('//span[@class="regular-price"]/text()') print(price) 但是，它没有像预期的那样从页面返回

浏览 1提问于2017-03-25得票数 1

回答已采纳

1回答

避免将外部元素包装在lxml中

、、、

>>> from lxml import html >>> html.tostring(html.fromstring('<div>1</div><div>2</div>')) '<div><div>1</div><div>2</div></div>' # I dont want to outer <div> >>> html.tostring(html.fromstring

浏览 3提问于2016-07-20得票数 1

回答已采纳

2回答

repl.it上的lxml请求

、、

我正在上尝试lxml请求，我不明白为什么它不能工作。程序直到最大重试时才停止运行，在此我得到了以下错误：回溯(最近一次调用)：requests.exceptions.ConnectionError: requests.exceptions.ConnectionError port=80中的文件"python"，第6行)：requests.exceptions.ConnectionError: /ws/index.php?pid=29400.html (由NewConnectionError('：未能建立新连接: Errno -2名称或服务未知‘)超出的最大重试)

浏览 2提问于2016-12-15得票数 0

回答已采纳

1回答

unicode文本的奇怪行为

、、

基本上我有这样的代码： page = requests.get("some_url" ) tree = html.fromstring(page.content) fo = codecs.open("path to file", "w", encoding='utf8') txt = tree.xpath("some_xpath_expr") fo.write( txt ) fo.close() 并将xpath保存到该文件。但当我这么做的时候： txt = page.content而不是txt=tree.

浏览 2提问于2016-01-18得票数 0

1回答

Python函数名..。未定义

、、

我正在做一些python内容请求，我想在我的代码中做一些函数，但是有一个错误，我不知道它为什么会显示出来。我的代码如下所示： def tempRequest(tree, heading): page = requests.get("http://10.0.0.3/admin/speedtest.php") tree = html.fromstring(page.content) heading = tree.xpath('//a[@id="temperature"]/text()') return heading

浏览 1提问于2019-03-02得票数 0

回答已采纳

2回答

XPath - get属性"href“

、、

如何使用XPath从html中获取"href“属性？ <td> <a href="http://www.stackoverflow.com"> <p>SERVER-45472</p> </a> </td> 为什么我只用这个"//a/@href“命令？为什么我不能使用这个查询- "/td//a/@href"？我想要做什么： from lxml import html tree = html.fromstring('<td>

浏览 24提问于2020-07-06得票数 1

回答已采纳

2回答

Web在python中抓取xml页面？

、

对于如何从给定的xml页面中刮掉所有的链接(只包含字符串"mp3")，我感到困惑。以下代码只返回空括号： # Import required modules from lxml import html import requests # Request the page page = requests.get('https://feeds.megaphone.fm/darknetdiaries') # Parsing the page # (We need to use page.content rather than # page.

浏览 0提问于2021-01-20得票数 0

回答已采纳

3回答

html的xpath选择导致元素响应

、、

from lxml import html import requests url = 'https://www.data.gov/' r = requests.get(url) doc = html.fromstring(r.content) link = doc.xpath('/html/body/header/div[4]/div/div/h4/label/small/a') print(link) 这让我一直在想： [Element a at 0x1c64c963f48] 响应，而不是我在页面中寻找的实际数字？知道为什么吗？另外，为什么我不能获得一

浏览 0提问于2017-04-10得票数 1

1回答

lxml xpath找不到锚点文本

、、、

我有两个x路径，其中只有一个正确地从下面的url中提取了职位名称。你知道为什么xpath1 (我发现它使用Chrome的“检查元素/复制XPath”功能)不能工作，而xpath2工作吗？ import requests from lxml import html url = 'http://www.mynextmove.org/find/browse?c=54' xpath1 = '//*[@id="content"]/table[1]/tbody/tr/td[1]/a/text()' xpath2 = '//a[contains(@

浏览 6提问于2015-05-21得票数 3

回答已采纳

2回答

NameError:未定义名称“QWebPage”

、

我是Python新手，我试图理解为什么我会遇到以下错误： Traceback (most recent call last): File "WebScraper.py", line 10, in <module> class Render(QWebPage): NameError: name 'QWebPage' is not defined 以下是代码： import sys from PyQt5.QtGui import * from PyQt5.QtCore import * from PyQt5.QtWebEngine

浏览 10提问于2017-01-20得票数 1

回答已采纳

1回答

Python html.fromstring

、

我试图用这段代码解析网页。 ac = requests.get('link....') html_text = ac.text lx = html.fromstring(html_text) 当我运行这段代码时，我得到了这个错误。 Traceback (most recent call last): File "Crawler.py", line 197, in <module> cnx.close() File "Crawler.py", line 46, in RequestPage lx = html.fromstring(ht

浏览 4提问于2016-12-28得票数 0

3回答

Python -帮助关于For循环

、、、、

我有这段python代码，它工作得很好我使用xpath来获取计划的标题，并使用此名称创建一个目录。 import requests from lxml import html import csv import os resp = requests.get( url="https://www.architecturaldesigns.com/house-plans/prairie-style-home-plan-14469rk", headers={'User-Agent':&

浏览 17提问于2019-12-12得票数 0

回答已采纳

1回答

我的网络爬虫正在抛出错误，而不是获取数据。

、

我想不出我在代码中做错了什么。Xpath没有问题。如果单独检查功能，则功能会很好。当我运行蜘蛛时，它会得到以下错误。基本上，它是在到达要处理的Layer2函数时发生的。当我签入第一次生成的链接时，我会注意到这些都是成熟的urls。现在我该怎么做才能得到结果。提前谢谢。蜘蛛： import requests from lxml import html def Startpoint(): address = "https://www.sephora.ae/en/stores/" page = requests.get(address) tree = ht

浏览 1提问于2017-04-19得票数 0

回答已采纳

1回答

用python中的lxml解析html页面

、、

我想用python中的lxml解析这个Xpath查询。 .//*[@id='content_top']/article/div/table/tbody/tr[5]/td/p/text() 我检查了Firepath中的xpath查询(xpath的firebug扩展)，它可以工作，但我的python代码没有显示任何内容。这是消息来源。 from lxml import html import requests page = requests.get("http://www.scienzeetecnologie.uniparthenope.it/avvisi.html

浏览 1提问于2015-08-02得票数 0

回答已采纳

1回答

为什么lxml找不到Chrome检查器给出的xpath？

、、、

这是我的代码： from lxml import html import requests page = requests.get('https://en.wikipedia.org/wiki/Nabucco') tree = html.fromstring(page.content) title = tree.xpath('//*[@id="mw-content-text"]/table[1]/tbody/tr[1]/th/i') print(title) 问题:打印(标题)打印"[]"，空列表。我希望这个能印上“纳布科”。X

浏览 1提问于2015-11-14得票数 5

回答已采纳

2回答

为什么python3递归函数返回null

、

我有一个函数，当达到一个利率限制时，它会再次调用它自己。它最终应该成功并返回工作数据。它正常工作，然后按预期的速度限制工作，最后，当数据恢复正常时，我得到： TypeError：“NoneType”对象不可订阅 def grabPks(pageNum): # cloudflare blocks bots...use scraper library to get around this or build your own logic to store and use a manually generated cloudflare session cookie... I don&#

浏览 0提问于2018-11-01得票数 0

回答已采纳

2回答

无法在excel文件中正确地写入提取的项？

、、、、

我用python编写了一些代码来解析网页中的标题和链接。最初，我试图从左边的栏中解析链接，然后通过跟踪每个链接从每个页面中抓取上述文档。我做得完美无缺。我试图将不同链接的文档保存在一个excel文件中不同的页面中。但是，它创建了几个“工作表”，从我的脚本中的标题变量中提取所需的部分作为工作表名。我面临的问题是-当数据被保存时，只有链接中的每个页面的最后记录保存在我的excel工作表中，而不是完整的记录中。下面是我尝试过的脚本： import requests from lxml import html from pyexcel_ods3 import save_data web_link =

浏览 7提问于2017-07-16得票数 2

回答已采纳

1回答

在python web抓取过程中触发js事件

、

# ./scrape.py from lxml import html import requests url = "http://www.my-target-url.com" page = requests.get(url) # can I insert some js event codes to execute here? tree = html.fromstring(page.content) print tree.xpath("/html/to/target/data/text()")[0] 我这样做是为了抓取目标页面，它有几个按钮可以更改数据。我

浏览 3提问于2015-12-27得票数 4

回答已采纳

1回答

python lxml xtree未从span获取编号

、、、

我正在尝试学习如何使用不同的语言来做不同的事情，我正在学习使用lxml进行web抓取，目前我只是想从html的span头文件中获取一个假设的页码，但我通过pages变量尝试的每个命令总是返回0或其他不同的东西。 from lxml import html import requests url = 'https://mangadex.org' page = requests.get(url) tree = html.fromstring(page.content) mangaLinks = tree.xpath('//a[@class="ma

浏览 0提问于2020-06-22得票数 1

1回答

如何从python中未正确关闭的标签中恢复文档？

、

这是我的问题我有一个示例文本，比如 text="""<!--translated from: The Dutch Royal Library """ 现在，我尝试从标记中剥离此文本，但使用以下代码时总是会出现此错误 t = html.fromstring(text) ctext = t.text_content() 我的错误是 Traceback (most recent call last): File "test.py", line 31, in <module> t = html.from

浏览 0提问于2013-12-19得票数 0

1回答

Python和Selenium - PHPSESSID cookie正在登录我

、、、、

我正试图从一个网站上抓取数据，以创建一个清单，列出最近的10个卷。我的代码： from lxml import html import requests page = requests.get('http://www.csgodouble.com/') tree = html.fromstring(page.content) #List of past rolls rolls = tree.xpath('//div[@class="past"]/text()') print 'Rolls: ', rolls 为什么没有输出数

浏览 1提问于2016-03-13得票数 1

回答已采纳

3回答

使用lxml从html中提取属性

、、

我使用lxml从html页面中检索标记的属性。html页面的格式如下： <div class="my_div"> <a href="/foobar"> <img src="my_img.png"> </a> </div> 我用来检索<a>标记内的url和同一<div>内的<img>标记的src值的python脚本如下： from lxml import html ... tree = html.fromstring(

浏览 2提问于2014-11-22得票数 5

1回答

面对使用GET请求的问题

、、、

当我运行第一个脚本时，它会获取结果，但当我运行第二个脚本时，我将一无所获。在我的第二个脚本中，我没有发现任何丢失的东西来获得所需的结果。第一个脚本中使用的url与我在developer工具中找到的需求连接在一起。当我使用基url和参数时，为什么我的第二个脚本不能工作？ import requests from lxml import html response = requests.get("http://www.ebay.com/sch/i.html?_from=R40&_trksid=p2050601.m570.l1313.TR0.TRC0.H0.Xfunny+bear.T

浏览 0提问于2017-05-26得票数 0

回答已采纳

1回答

将刮过的文档保存在excel文件中的两个工作表中。

、、、、

我创建了一个刮板，它应该解析网页中的一些文档，并将其保存到一个excel文件中，创建两个工作表。但是，当我运行它时，我可以看到它只将最后一个链接的文档保存在一个单张中，而应该有两个带有来自两个链接的文档的工作表。我甚至打印了结果，看看背景中发生了什么，但我发现没有什么不对。我认为，第一页是覆盖的，第二页从未创建。如何绕过这个问题，以便将数据保存在excel文件中的两个工作表中。事先谢谢您来看一下。这是我的代码： import requests from lxml import html from pyexcel_ods3 import save_data name_list = ['

浏览 1提问于2017-09-01得票数 0

回答已采纳

1回答

为什么lxml在解析时关闭这个"ol“标记？

、

下面是一些HTML： <ol><ul><li>item</li></ul></ol> 还有一些用lxml解析并重新打印它的python 3代码： import sys from lxml import etree, html document_root = html.fromstring(sys.stdin.read()) print(etree.tostring(document_root, encoding='unicode')) 这是输出： <div><ol/><ul&

浏览 3提问于2021-07-26得票数 1

回答已采纳

2回答

面临从表中获取数据的问题

、、、

用python编写一个脚本从表中获取数据，当我使用xpath时，我根据它的行格式和列格式获取数据。然而，当我使用css选择器时，我得到了一个错误'list‘对象没有属性'text’。如何绕过这一点？提前谢谢？使用工作正常的xpath： import requests from lxml import html url="https://fantasy.premierleague.com/player-list/" response = requests.get(url).text tree = html.fromstring(response) for ti

浏览 4提问于2017-07-22得票数 0

回答已采纳

1回答

Python编码ValueError消息

、、

我正在运行以下web刮刀代码： 25 # save source page and return xpath tree 26 def scrape_Page(url, path): 27 page = requests.get(url) 28 tree = html.fromstring(page.text) 29 # save html content 30 file_name = url.split('/')[-1] + ".html" 31 with open(os.path.join(path, fi

浏览 11提问于2014-10-15得票数 0

回答已采纳

1回答

python lxml xpath获取具有特定字符串模式的节点属性。

、、、、

我正在学习xpath，并尝试使用python /html获取具有特定节点属性的节点的值(例如，)。从下面的代码中，我希望从节点"a“获得以"mailto:”开头的"href“属性的开发人员电子邮件值。我的python代码片段返回应用程序名，但空的开发人员电子邮件。谢谢 <html> <div class="id-app-title" tabindex="0">Candy Crush Saga</div> <div class="meta-info meta-info-wide"&g

浏览 6提问于2016-04-22得票数 0

回答已采纳

1回答

不明白为什么这个TypeError:必须是str，而不是浮动异常

、、、

st1= str() c1= str() c2= str() EndCash = float() page = requests.get('http://www.xe.com/currencyconverter/convert/?Amount=' + str(st1) + '&From=' + (c1) + '&To=' + (c2)) tree = html.fromstring(page.content) rate = tree.xpath('//span[@class=

浏览 3提问于2017-04-27得票数 0

回答已采纳