Python web抓取空结果_使用Python web抓取获取空返回_如何保存web抓取Python的结果 - 腾讯云开发者社区

php、python、asynchronous

我有一个建立一个网络刮擦工具的要求。抓取部分将在python中编码，结果将在PHP中显示。结果应该在PHP中异步显示，而python正在抓取页面。客户认为python是快速和更好的web抓取的选择。您认为混合python和php仍然会带来快速的结果吗?还是坚持使用php进行web抓取更快/更好？在这两种语言之间异步交换数据的首选方法是什么？谢谢!

浏览 3提问于2017-05-04得票数 1

回答已采纳

1回答

无法从web表中刮取新冠肺炎数据

python、web

我正在用Python研究新冠肺炎在科索沃的传播。问题是，从表上的web抓取中得到的结果是空的。网络是表，我需要它的记录：我使用了许多方法提取记录，但没有成功，使用的最新代码仅用于标题： import requests import pandas as pd from bs4 import BeautifulSoup link = 'https://corona-ks.info/?lang=en' # get web data req = requests.get(link) # parse web data soup = BeautifulSoup(req.co

浏览 2提问于2021-03-18得票数 1

回答已采纳

2回答

如何将python抓取到excel中

python、excel、web-scraping

我想知道如何让python web抓取所有的结果到excel中。这并不是我不知道如何抓取网页，而是我不知道如何抓取excel。

浏览 2提问于2012-04-21得票数 2

3回答

(BeautifulSoup，请求)

python、web、web-scraping、beautifulsoup、python-requests

我正在学习使用python进行web抓取，但是我无法获得预期的结果。下面是我的代码和输出代码 import bs4,requests url = "https://twitter.com/24x7chess" r = requests.get(url) soup = bs4.BeautifulSoup(r.text,"html.parser") soup.find_all("span",{"class":"account-group-inner"}) [] 这是我想要刮的东西我一直得到一个空数组。请帮帮忙。

浏览 1提问于2017-10-21得票数 0

回答已采纳

1回答

如何在heroku中的rails应用程序中运行python脚本？

python、ruby-on-rails、heroku、web-scraping、scrapy

我在heroku中托管了一个rails应用程序。我还用python中的scrapy编写了一个web刮刀。我需要从heroku中的rails应用程序中运行python脚本，我将用一个例子来解释。例:用户将输入url在我的rails app.Then中进行抓取，rails应用程序将控制权交给python来抓取数据，该脚本以json object.Then的形式发送响应，我们必须在web应用程序中呈现json结果，我必须在heroku中托管这个应用程序。

浏览 2提问于2013-10-24得票数 3

回答已采纳

1回答

如何让django项目点击url的特定标签

python、python-3.x

我正在开发一个使用python和Django的网页抓取代码。我已经提供了所需的url，并且已经获取了数据。但是在url上有一个标签，上面写着“显示更多结果”。如何让我Django项目点击url上的“显示更多结果”选项卡并立即获取新的结果。我已经使用Beautiful Soup库来进行web抓取/

浏览 16提问于2021-04-15得票数 0

2回答

使用Bash脚本在python库上进行web抓取？

python、bash、curl、sed、web-scraping

我正在尝试从有经验的人那里获取更多的信息，一般来说，我正在使用Python库进行web抓取。与此同时，我注意到一些人正在使用simple Bash，并使用wget, curl, sed, grep, awk等命令进行web抓取。与使用Python库进行web抓取相比，这些命令在脚本编写方面似乎要干净得多。你对此有什么看法？您认为使用python库比使用Bash有什么优势吗？或者甚至使用Python和Bash来完成web抓取？

浏览 1提问于2017-03-03得票数 0

1回答

如何使用python从flashscore中抓取足球结果？

python-3.x、web-scraping、beautifulsoup、python-requests

Web抓取Python “我还是个新手。我想获取2018-19赛季英超联赛的结果(赛程，结果，日期)，但我很难浏览这个网站。我得到的只是空列表/无。如果你有一个可以分享的解决方案，那将是一个很大的帮助。‘ “这就是我尝试的方法。” “”“ import pandas as pd import requests as uReq from bs4 import BeautifulSoup url = uReq.get('https://www.flashscore.com/football/england/premier-league-2018-2019/results/')

浏览 43提问于2020-04-24得票数 2

回答已采纳

2回答

Web应用程序体系结构和应用程序服务器？

php、python、model-view-controller、cakephp、application-server

我正在构建一个web应用程序，并且我需要使用一个允许我在两个服务器上运行它的架构。该应用程序定期从其他站点抓取信息，并根据最终用户的输入进行抓取。为此，我使用Php+curl抓取信息，使用Php或python解析信息并将结果存储在MySQLDB中。然后，我将使用Python对数据运行一些算法，这将定期发生，也会在最终用户输入时发生。我将在MySQL DB中缓存一些结果，有时如果它是特定于用户的，则跳过存储数据并将其提供给用户。我正在考虑在一台单独的web服务器上使用Php作为网站前端，在另一台服务器上运行Php spider、MySQL DB和python。对于这类工作，我应该使用什么框

浏览 2提问于2010-06-11得票数 3

回答已采纳

4回答

用web抓取来填写(和检索)搜索表单？

forms、search、screen-scraping、doi

我想知道是否有可能“自动化”输入条目以搜索表单并从结果中提取匹配的任务。例如，我有一个想要获取DOI(数字对象标识符)的期刊论文列表；为此，我将手动转到期刊文章搜索页面(例如，)，键入作者/标题/卷(等)。然后从返回的结果列表中找到文章，选择DOI并将其粘贴到我的参考列表中。我经常使用R和Python进行数据分析(我的灵感来自于RCurl上的一篇文章)，但对web协议了解不多……这样的事情是可能的吗(比如使用Python的BeautifulSoup?)有没有什么好的参考资料可以帮助你完成类似的任务呢？我只是对学习web抓取和web抓取工具感兴趣，就像完成这个特定的任务一样……耽误您时间，实在对

浏览 1提问于2009-07-23得票数 8

回答已采纳

1回答

Python中的Web抓取

python、web-development、scraping

我需要学习高级python编程技能才能使用python进行web抓取吗？或者，我应该看一些关于网络抓取的教程，同时学习使用python。我对python没有任何经验，因为我是Laravel开发人员，这是我第一次在web抓取中做这样的工作。

浏览 0提问于2019-11-04得票数 -1

1回答

在Python web抓取中不会对某些类进行抓取

python、web-scraping、web-crawler

**这是一个韩国金融门户网站，显示名为"Kona i“的韩国公司的股票信息。我是个初学者，刚开始用Python学习web抓取。我试图用BS来计算这只股票的价格。在网页中，股票价格的标签和类别分别是em，"curPrice up“。所以我在选择器部分加上了"em.curPrice up“。当我把它打印出来的时候，结果却是一张空的清单。它有什么问题？ price = requests.get("http://finance.daum.net/item/main.daum?code=052400") html = bs(price.text, "l

浏览 2提问于2018-09-12得票数 0

1回答

获取数据后返回数据JavaScript

javascript、node.js、asynchronous、callback、asynccallback

使用nodeJS。我有一个主文件，它调用一个网络抓取器，它转到几个链接并从站点获取原始数据，然后下一行调用网络抓取器文件中的一个函数，该函数将一个JSON对象返回给主文件。但是因为它需要一小段时间去抓取网站，所以返回的结果是返回一个空对象。如何使用回调或其他方法在调用get方法之前等待数据。主文件 var test = require('web-scraper.js'); test.scrape(next); function next() { var json = test.getJSON(); } web-Scratper.js(它使用模块导出，位于node

浏览 2提问于2016-12-19得票数 1

1回答

如何隔离网络刮擦的分类区域？

python、web-scraping、terminal、scrapy

webscraping的新手，我正在使用scrapy和python从特定网站抓取所有类别。其中包含web源代码(picture of web source)，我尝试过的代码如下所示。我正在尝试分离类别，对于类"dropdown-submenu“中的每一项，它们都落在href="/categories#”之后。我试过category_urls = response.css("categories").xpath("@href").extract() category_urls = response.css(".link-list-colu

浏览 13提问于2020-09-26得票数 0

回答已采纳

2回答

是否可以从Julia调用Python函数并返回其结果？

python、julia

我正在使用Python从web上抓取数据。我想用这些数据在Julia中运行计算。有没有可能在Julia中调用函数并返回其结果，或者我只是导出到CSV并以这种方式加载数据会更好？

浏览 2提问于2017-10-09得票数 3

2回答

Python 3 web抓取选项

python-3.x、web-scraping

我是Python的新手，所以很抱歉这是一个新手问题。我正在尝试构建一个涉及web抓取的程序，我注意到Python3的web抓取模块似乎比Python2.x系列少得多。美汤、机械化和scrapy -这三个模块向我推荐--似乎都是不兼容的。我想知道这个论坛上有没有人有使用python3进行网络抓取的好选择。任何建议都将不胜感激。谢谢，威尔

浏览 1提问于2011-08-11得票数 5

1回答

我能做一个有python程序文件的应用程序吗？

android、server、android-sqlite

我对android程序很陌生。我给你举个例子，说明我的问题到底是什么意思。我想做一个应用程序，返回一个结果的网页抓取/刮(也许‘刮’似乎更合适)。例如，如果应用程序用户选择“块链”作为感兴趣的主题，我的应用程序就会将包含“区块链”这个词的文章链接还给他，这些文章是由于在特定的报纸网站上进行网络抓取而产生的。我已经用python做了一个网络抓取程序。所以，我想把这个程序连接到一个android应用程序，这样每当应用程序用户通过一个应用程序给出他们感兴趣的话题时，我就可以给他们返回网络抓取的结果。提前谢谢你回答我的问题。我一直在寻找答案，似乎我的应用程序应该链接到服务器和数据库。那

浏览 1提问于2018-11-03得票数 0

回答已采纳

3回答

自动翻译以供个人使用

python、web-scraping、translation

我想为我正在编写的应用程序翻译几百个单词。这是一个简单的一次性项目，所以我不愿意为google translate API付费。有没有其他web服务可以做到这一点？另一个想法是向谷歌发送一个搜索，然后从第一个结果中抓取结果。例如，谷歌“将食物翻译成西班牙语”。然而，页面是一堆混乱的javascript，我需要帮助来抓取结果。我认为python对此很好，但任何语言都可以。

浏览 0提问于2012-10-04得票数 0

回答已采纳

1回答

获得通行证不支持GL，尽管它已启用；无法运行web刮取python脚本。

python-3.x、google-chrome、web-scraping、selenium-chromedriver

使用Chrome和ChromeDriver运行python脚本进行web抓取。脚本运行，我可以看到它正在查询网站，但一旦完成，它就失败了。脚本最终创建了CSV文件，但是它是空的，没有web抓取数据。继续获得一个不支持GL的通行证，即使我启用了它。我使用了以下堆栈溢出步骤来确保启用GL：。WebGL并不是作为启用选项而存在的，因此我启用了WebGL草案扩展。除了传递之外，error...intermittently还得到握手错误。我已经确定我的Chrome驱动程序和Chrome是相同的版本。我已经安装了一个旧版本的Chrome与一个旧版本的Chrome驱动程序，但这是行不通的。不知道还能尝试

浏览 1提问于2021-06-26得票数 4

2回答

Selenium.common.exceptions.NoSuchElementException错误即使有显式等待

python、selenium、web-scraping

，怎么了？我目前正在尝试从subreddit中抓取数据(我使用的是旧的reddit ->扩展名，它以这种方式恢复了reddit的旧外观，这样更容易抓取)，但是每当我试图获得结果时，我都会从这段代码中得到错误： xpath = "//a[@class='title may-blank loggedin ']" element = driver.find_element_by_xpath(xpath) selenium.common.exceptions.NoSuchElementException:消息:没有这样的元素:无法定位元素：{“方法”：“xpat

浏览 0提问于2021-02-06得票数 0

回答已采纳

1回答

在Azure云上部署Python Web抓取文件(函数应用程序)

python、azure、selenium-webdriver、web-scraping、beautifulsoup

我有两个python文件，它们使用Selenium和Beautifulsoup进行Web抓取，并将结果存储在单独的CSV文件中，即file1.csv和file2.csv。现在，我想将这些文件部署到Azure云上，我知道Azure函数应用程序将是理想的选择。但是，我不知道函数应用程序将如何支持Selenium驱动程序。基本上，我想定时触发我的两个web抓取文件，并将结果存储在两个单独的文件file1.csv和file2.csv中，这两个文件将存储在Azure云上的blob存储中。有人能帮我完成这项任务吗？如何在Azure函数应用程序上使用selenium驱动程序？

浏览 12提问于2020-12-18得票数 0

回答已采纳

2回答

初学抓取，不断得到空列表

python、xpath、web-scraping

我决定尝试使用Python (使用lxml和请求)进行web抓取。我想要学习的网页是：我想刮的是网页左边的表格(用到的分数和队形的表格)。下面是我正在使用的代码： from lxml import html import requests page=requests.get("http://www.football-lineups.com/season/Real_Madrid/2013-2014") tree=html.fromstring(page.text) competition=tree.xpath('//*[@id="sptf"]/table

浏览 1提问于2014-06-11得票数 1

1回答

用Laravel和Selenium进行Web抓取

php、laravel、selenium、web-scraping

我目前正在使用Python进行web抓取。我使用了Selenium和Beautifulsoup库来抓取。我最近知道Selenium适用于php/Laravel。我的问题是，我可以使用Laravel + Selenium web驱动程序抓取web吗？如果是，你能给我提供一些链接或存储库，以便我学习吗？我被迫在我的抓取工作中使用php/Laravel，因为他们说php很容易在服务器上部署/执行来进行实时抓取。

浏览 19提问于2019-11-19得票数 0

1回答

CRONTAB执行Python时，执行Node的puppeteer无法执行web抓取

javascript、python-3.x、web-scraping、cron、puppeteer

我做了这个网页抓取器来获取网页中的表格。我使用了puppeteer (不知道crontab有问题)，使用Python进行清理，并将输出处理到DB 但令我惊讶的是，当我像这样执行它时 */50 * * * * cd path /python3 /script.py >> cron.log 2>&1 它会执行，但日志文件为空，并且数据库中没有任何信息。我在Github上做了一个例子： https://github.com/GST5555/web_scrapper_get_tables 我不想做一个shell来执行它。

浏览 8提问于2020-01-28得票数 0

1回答

用bs4 (漂亮汤)python2.7发布抓取网站

python-2.7、web-scraping、beautifulsoup

我试图完成的是一个简单的python web脚本，用于搜索google趋势，并在抓取类时遇到一个问题。 from bs4 import BeautifulSoup import requests results = requests.get("https://trends.google.com/trends/trendingsearches/daily?geo=US") soup = BeautifulSoup(results.text, 'lxml') keyword_list = soup.find_all('.details-top')

浏览 4提问于2020-03-27得票数 2

回答已采纳

1回答

用于Web抓取的Python或基于JS的REST

javascript、python、web-services、rest、web-scraping

我正在尝试通过REST构建Python/JS Web服务。我的设想如下：用户点击我网站上的一个按钮我的网站向REST发送HTTP请求 Web抓取发生在服务器端(使用Python或Node)。第三方网站上的数据是动态加载的。结果以JSON格式发送回我的网站，并显示给用户我检查了许多Python托管服务。我不知道他们是否支持硒。JS库和NodeJS主机也是如此。基本上我很困惑。我应该为我的项目和刮取动态数据使用什么？带硒的Python？NodeJS和PhantomJS和Cheerio？

浏览 2提问于2017-06-25得票数 2

2回答

当web在Python中搜索表时，返回一个空表。

python

我需要通过使用Python中的BeautifulSoup库进行web抓取，从网站抓取一个表。来自URL https://www.nytimes.com/interactive/2021/world/covid-vaccinations-tracker.html 当我运行这段代码时，我得到了一个空表： import requests from bs4 import BeautifulSoup # vaacineProgressResponse = requests.get("https://www.nytimes.com/interactive/2021/world/covid-vacc

浏览 0提问于2021-04-18得票数 3

回答已采纳

2回答

在Azure上计划web抓取作业并在ADLS上存储结果

python、azure、u-sql

我有一个python作业，它使用漂亮的汤从job上抓取数据。我尝试使用U-SQL执行脚本，但我一直收到一般的错误消息： An unhandled exception from user code has been reported 我没有过多地研究这个错误，因为我不确定是否有可能通过U-SQL来抓取web。这是否可以使用U-SQL，如果不可以，我可以使用哪个Azure资源来计划此脚本并将结果存储在Azure数据湖存储上？

浏览 2提问于2018-01-03得票数 0

2回答

pyplot动画示例代码不会生成动画

python、animation、matplotlib

我正在努力跟上pyplot中的动画功能。我抓取了这里给出的示例代码：我正试着自己运行它。我得到的结果是没有任何动画的空轴。我的设置是anaconda 4.3，python 3.6。Matplotlib的版本是2.0.0，我在jupyter笔记本上运行它。我在Windows7和Mac上都试过IE 11、Chrome 59和Firefox 54。

浏览 10提问于2017-07-13得票数 0

回答已采纳

2回答

如何创建一个调用python抓取脚本的web服务？

python、python-2.7、web-scraping、bottle

我是python初学者，我需要一些帮助来创建一个web服务，该服务调用python抓取脚本(一门课程的任务)。我可以用瓶子创建web服务。我想使用static_file来调用脚本，但我不确定，因为文档中说static_file是用于CSS的。其想法是首先创建web服务，然后使用服务器上的web抓取脚本。感谢哥伦比亚的帮助和问候！我没有很好的英语，但我希望有人能理解我，帮助我。

浏览 3提问于2015-12-16得票数 0

回答已采纳

0回答

通过BeautifulSoup找到音节的个数？

python、html、beautifulsoup

我是编程新手，目前正在尝试学习python。我的目标是使用网络抓取，或者更具体地说，BeautifulSoup在dictionary.com上抓取单词的音节，作为更大代码的一部分。这是我到目前为止所知道的： def count_syllables(keyword): url = 'http://dictionary.com/browse/{}'.format(keyword) web_object = requests.get(url) text = web_object.text text = text.encode('utf-8

浏览 3提问于2017-06-09得票数 0

回答已采纳

1回答

如何判断某个网站是否阻止了我的抓取代码

python、web-scraping、beautifulsoup

我正在学习web抓取，我写了一些使用Python和Beautiful Soup4从抓取信息的代码，有时代码会停止，然后崩溃。该错误消息与应填充的列表为空相关。在它崩溃后，我尝试在我的浏览器中手动访问该网站，但页面永远不会打开。如果我稍后再试一次，它会正常打开。所以我猜这个网站不喜欢我在短时间内访问它太多，并暂时阻止我或类似的东西。我的问题是，有没有一种方法可以确定阻止我请求的网站是问题所在？还有，有没有办法解决这个问题呢？也许是通过在请求之间引入延迟？

浏览 0提问于2019-01-08得票数 0

2回答

用美丽汤为id=“作者”抓取

python、beautifulsoup、css-selectors

我正在学习如何使用Python进行web抓取，并获得了以下html文件： <html><head><title>The Website Title</title></head> <body> <p>Download my <strong>Python</strong> book from <a href="http://inventwithpython.com">my website</a>.</p> <p class="

浏览 0提问于2018-05-25得票数 0

回答已采纳

1回答

启动django项目建议

python、django

背景:我有一个辅助项目的想法，我可以最好地将其描述为expedia.com/kayak.com和维基百科的结合。主网站将使用API、web抓取/屏幕抓取或其他技术来填充从外部来源生成的搜索结果。我还会创建一个社区(如维基百科)，用户可以在其中编辑搜索结果中的内容(如果我太含糊了，我道歉) 问题:我在python和Django方面的经验有限，我觉得看youtube教程对我没有好处。谁能提供一些建议，关于我可以工作的项目或我可以观看的教程，以便我可以建立在我的这个项目上工作的信心。提前谢谢你

浏览 3提问于2016-11-03得票数 0

3回答

使用Python中的导出按钮下载/导出站点搜索结果

python

因此，我试图使用Python从以下网站抓取数据(使用示例查询)：然而，我没有抓取搜索结果，而是意识到，如果我以编程的方式单击Save results as " CSV“链接，并处理CSV数据，这样就更容易了，因为它可以使我不必浏览搜索结果的所有页面。我检查了CSV链接元素，发现它被称为"exportSearch('csv')函数“。通过在控制台中键入函数的名称，我发现CSV链接只是将window.location.href设置为:window.location.href 如果我在同一个浏览器中遵循该链接，则保存提示符将用csv打开以保存。当我想要

浏览 2提问于2020-02-19得票数 1

1回答

Html中的XPath表达式问题

xpath、html-agility-pack

我正在使用Html Agility Pack对Google搜索结果执行基本的web抓取。作为XPath的新手，我确保我的路径表达式是正确的(在FirePath的帮助下)。但是，返回的HtmlNodeCollection始终为空。 HtmlWeb web = new HtmlWeb(); HtmlAgilityPack.HtmlDocument htmlDoc = web.Load("http://www.google.com/search?num=10&q=Hello+World"); // get search result URLs var items = htm

浏览 4提问于2012-08-29得票数 0

回答已采纳

1回答

如何将列表值逐个放入网站，并将这些值放入网站文本框区域，并使用python获得输出？

python、web-scraping

我有一个值列表。我想要的是，转到这个典型的网站，从我的列表中选择值，填充这些列表值，并使用python获得输出。例如，mylist=apple，三星，华为和列表，假设网站是Amazon.com，我想把这些列表值放到亚马逊页面的典型文本框区域，并使用python返回输出。我尝试过网络抓取，它看起来像是从网络上提取数据。而不是将数据推送到web上并获得结果。

浏览 13提问于2020-01-31得票数 0

4回答

如何检查web.py/python中sql查询结果是否为空

python、mysql、web.py

我正在开发web.py框架中的一个web应用程序，需要一种让web.py/python检查sql查询结果是否为空的方法。下面是我当前的函数： def get_hours(): result = dbconn.query("select * from hours where date < (select max(date) from last_export) order by date DESC") return result 这按预期工作，但如果查询结果为空，我希望函数返回False。我已经知道，如果不使用循环计数，python无法返回可迭代对象中有多少

浏览 1提问于2012-01-02得票数 0

回答已采纳

2回答

将Python脚本连接到Nodejs

python、node.js

完成Node.js新手入门。最近，我接到一个任务，用python在web上抓取一个网站，然后使用Node.js中的python-shell包将python脚本连接到Node.js。我已经完成了抓取部分，但对Node.js没有任何先验知识。你能指导我如何解决这个问题吗？

浏览 0提问于2020-01-07得票数 0

1回答

有没有任何快速的方法来刮一个有无限滚动的网站？

python、web-scraping

我正在尝试使用python来抓取一个用无限滚动实现的网站。实际上，网络就是pinterest。我知道如何使用selenium来抓取具有无限滚动的web。但是，WebDriver基本上模仿了访问web的过程，而且速度慢得多，比使用BeautifulSoup和urllib进行抓取要慢很多。你知道有什么时间有效的方法来刮一个无限滚动的网页吗？谢谢。

浏览 0提问于2014-12-29得票数 0

回答已采纳

3回答

如何在python中并行抓取多个html页面？

python、django、multithreading、beautifulsoup、python-multithreading

我正在用Django web框架用Python制作一个网络抓取应用程序。我需要用漂亮的汤库抓取多个查询。下面是我写的代码的快照： for url in websites: r = requests.get(url) soup = BeautifulSoup(r.content) links = soup.find_all("a", {"class":"dev-link"}) 实际上，网页的抓取是按顺序进行的，我想以并行的方式运行它。我对Python中的线程化不是很了解。谁能告诉我，我怎样才能并行抓取？任何帮助都将不胜感激。

浏览 0提问于2017-05-29得票数 2

2回答

使用重复类在Selenium + Python中查找元素

python、selenium、web-scraping、selenium-chromedriver

我正在使用Selenium + Python在Battlefy页面上抓取匹配结果，以便稍后操作并进入数据库。我正在尝试使用Selenium抓取团队的名称和结果，因为动态加载JS需要我使用无头浏览器。但是，我尝试使用类名获取每个大学的文本，但是使用Selenium的find_elements_by_class_name方法似乎行不通。网页：当前代码： >>> chrome_path = r"C:\Users\...\chromedriver.exe" >>> driver = webdriver.Chrome(chrome_path) &g

浏览 0提问于2020-02-15得票数 2

1回答

从网络抓取开始

javascript、python、web-scraping

首先，我想让您知道，我对html和css非常陌生，目前我还不知道如何使用Java脚本。我在看关于如何制作网络刮刀的视频，我有一些问题：我看到了很多教程在python中进行web抓取，因为我非常了解python，所以我问自己，什么更适合web抓取？Python还是Java脚本，我应该使用哪一个？我可以将python程序与html连接起来吗？我需要使用网站抓取一个网站，我正在尝试做一些事情，从其他网站获取特定的数据，然后显示在我的网站上，这样人们就可以看到他们。你对如何开始有什么建议吗？请注意，我不是太好的英语，没有教程或视频的网页刮我的语言和借口在这篇文章的错误。

浏览 1提问于2019-12-31得票数 0

回答已采纳

1回答

使用BeautifulSoup在Python3中抓取页面上两个表中的第二个

python、html、web-scraping、beautifulsoup

我正在努力提高我的python技能，我只想从这个页面的中抓取“结果”表。我是网络抓取的新手，有没有人能帮我提供一个优雅的抓取结果维基的解决方案？谢谢!

浏览 1提问于2020-06-07得票数 0

8回答

Scrapy和代理

python、scrapy

如何利用python web抓取框架Scrapy的代理支持？

浏览 2提问于2011-01-17得票数 47

回答已采纳

1回答

Python中Web抓取的问题:返回空值

python、html、web-scraping

我是Python新手。当我在Python中运行下面的代码进行web抓取时，我会得到一个空值。我正在尝试从指定的url打印比特币的价格。请帮帮忙。 `import bs4` import requests url='https://coinmarketcap.com/' res=requests.get(url) soup = bs4.BeautifulSoup(res.text,'html.parser') element=soup.select('html.js.video.videoautoplay body div.container

浏览 3提问于2018-01-10得票数 1

回答已采纳

1回答

在Java中使用Python库(IntelliJ)

java、python、intellij-idea、praw

我目前正在用Java创建一个不和谐的机器人，并决定用python写一个脚本，因为它有被证明对web抓取非常有用的库。通过使用Jython，我能够运行脚本。机器人成功上线，然而，它导致了以下结果： ImportError: No module named praw 当我在另一个IDE中单独运行python脚本时，它工作得很好。我想知道我是否必须在gradle中添加praw作为依赖项？我们非常感谢您的建议。

浏览 19提问于2021-07-27得票数 0

0回答

使用R分析的Django Web应用程序

r、django、rpy2

我已经在R上做了一些数据分析，现在我愿意在Django Web应用程序上显示结果和可视化，我应该怎么做？ 1)将结果保存到数据库中，独立制作Django应用，同时通过从数据库中抓取显示结果。 2)我不确定，但是rpy2在这里有什么作用呢？我是否应该在python中调用我的R函数并创建一个Django应用程序(如果这一点没有意义，请原谅)

浏览 5提问于2018-07-18得票数 0

2回答

尝试获取除前5个标记之外的所有锚标记

css、web-scraping、css-selectors

尝试用[anchor-tag]选择所有锚标签，但不想抓取前3个都被选中的锚标签。我试过:not()，但不能让它工作。我注意到我不想抓取的前3个锚点是在一个div类.web-container中。我尝试检查元素，然后按CTRL +F并找到.web-content a[anchor-tag]，结果显示为43，当我对其进行:not(.web-container)加法时，得到的结果为0。在inspect元素中测试它和/或通过跳过css选择器列表中的前3个来让它只显示我想要的元素？我尝试了:not()和不同的，但我没有得到我想要的结果，我找到了53个项目，但只尝试跳过前3个并抓取下一个50个(跳过前

浏览 13提问于2019-07-02得票数 0

2回答

使用python和sqlite进行Web抓取。如何有效地存储抓取的数据？

python、sqlite、web-scraping

我想定期抓取一些特定的网页(例如每小时)。我想用python来做这件事。抓取的结果应该插入到一个SQLite表中。新的信息将被抓取，但“旧的”信息也将再次被抓取，因为python脚本将每小时运行一次。更准确地说，我想要抓取一个体育结果页面，其中随着锦标赛的进行，越来越多的比赛结果会发布在同一页面上。因此，对于每一次新的抓取，我只需要将新的结果输入到SQLite表中，因为旧的结果在一个小时前(甚至更早)已经被抓取(并插入到表中)。我也不想插入相同的结果两次，当它被第二次刮掉的时候。所以应该有一些机制来检查一个结果是否已经被刮掉了。这可以在SQL级别上完成吗？因此，我抓取了整个页面，为每个结果

浏览 0提问于2013-04-17得票数 5

回答已采纳