Python web-scraping在抓取表内容时不返回任何内容/null

Python web-scraping是指使用Python编程语言来从网页中提取数据的技术。在抓取表内容时不返回任何内容或返回null可能是由于以下几个原因：

网页结构变化：网页的结构可能会发生变化，导致之前编写的抓取代码无法正确解析表内容。这可能是因为网站更新了布局或使用了新的技术，需要相应地调整抓取代码。
动态加载内容：有些网页使用JavaScript来动态加载表内容，而不是在初始加载时就将所有内容呈现出来。在这种情况下，简单的静态抓取代码可能无法获取到动态加载的表内容。解决方法是使用工具或库，如Selenium或Scrapy，来模拟浏览器行为并获取完整的页面内容。
访问限制：有些网站可能对抓取行为进行限制，例如通过IP封锁、验证码或登录要求等方式。如果没有正确处理这些限制，抓取代码可能无法成功获取表内容。解决方法包括使用代理IP、处理验证码或模拟登录等。

针对以上问题，腾讯云提供了一系列相关产品和服务来帮助解决Python web-scraping中的挑战：

腾讯云函数（Serverless）：提供无服务器计算服务，可以在云端运行Python脚本，实现自动化的网页抓取和数据提取。
腾讯云虚拟机（CVM）：提供可扩展的云服务器实例，可以部署Python抓取代码并定期执行。
腾讯云内容分发网络（CDN）：加速网页加载速度，提高抓取效率。
腾讯云API网关：用于管理和发布API接口，可以将抓取结果以API形式返回。
腾讯云数据库（TencentDB）：提供可靠的云数据库服务，用于存储和管理抓取到的数据。

请注意，以上仅是腾讯云提供的一些相关产品和服务，其他云计算品牌商也可能提供类似的解决方案。

未能在木偶技师中使用xpath刮取到下一页的链接

、、、、

我正在尝试从这个中抓取下一页的链接。我知道如何使用css选择器来抓取。但是，当我试图使用xpath解析同样的内容时，事情就会出错。是我得到的，而不是下一个页面链接。 const puppeteer = require("puppeteer"); let url = "https://stackoverflow.com/questions/tagged/web-scraping"; (async () => { const browser = await puppeteer.launch({headless:false}); const

浏览 1提问于2021-09-16得票数 0

回答已采纳

1回答

来自Aminer API的请求

、

我刚接触python和web-scraping。我需要找到一个特定主题的所有出版物，如“医疗保健”与Aminer API的相应作者。以下是文档和我的尝试： import requests par = {'query': 'healthcare'} re = requests.get('https://api.aminer.org/api/search/person', params=par) print(re.text) 这给了我一个空的结果。但是，当我在"“中输入它时，它就可以工作了。非常感谢您的帮助。谢谢。

浏览 12提问于2018-02-16得票数 2

回答已采纳

1回答

libpcap pcap_open_live()：BIOCSRTIMEOUT:无效参数

、

使用以下代码，在运行可执行文件时会得到此错误： ... dev = pcap_lookupdev(errbuf); if(dev == NULL) { printf("%s\n",errbuf); exit(1); } printf("DEV: %s\n",dev); descr = pcap_open_live(dev,BUFSIZ,0,-1,errbuf); if(descr == NULL) { printf("pcap_open_live(): %s\n",errbuf); exit(1); } packe

浏览 3提问于2014-01-13得票数 1

回答已采纳

1回答

逐个循环jpgs文件下载到计算机

、、、

我正试着自学一些蟒蛇，我一直在看youtube视频:) 我的一个任务是抓取一张照片并将其下载到我的工作文件夹中。我解决了它，但想要更进一步。我创建了一个jps列表，并希望逐个迭代它们并下载它们。以下是我到目前为止拥有的代码： base = 'https://keithgalli.github.io/web-scraping/' test = [ linkz.find('img').get('src') for linkz in find_all]. urls = [urljoin(base, t) for t in test] gets me

浏览 17提问于2020-10-30得票数 0

回答已采纳

2回答

查询选择Where null vs <>'‘未正确筛选

、

我的查询有一个问题，我有数字单元格和文本单元格，如果所有的单元格都是空的，我不想检索它们，但是，如果任何单元格不是空的，我想检索该行。我知道is not Null用于数字单元格，<>''用于文本单元格。例如：假设这个表在原始数据表中是这样的。工作表被称为“数据”。 Column | A | B | C | D | Cell Type | Number | Text | Number | Text | Row1 | 7

浏览 0提问于2015-10-07得票数 7

回答已采纳

1回答

与异步相结合的pyppeteer抓取内容

、、、、

我用python和pyppeteer以及asyncio一起编写了一个脚本，从它的登陆页面中抓取不同帖子的链接，并通过跟踪指向其内部页面的url最终获得每个帖子的标题。我在这里分析的内容不是动态的。但是，我使用了pyppeteer和asyncio来查看它执行asynchronously的效率。下面的脚本执行得很好，但随后出现了一个错误： File "C:\Users\asyncio\tasks.py", line 526, in ensure_future raise TypeError('An asyncio.Future, a coroutine or an awa

浏览 0提问于2018-12-13得票数 3

回答已采纳

1回答

解析网页时调用onclick方法

、、、

免责声明:这是我第一次尝试网络抓取。如果这是一个非常简单的问题，请不要介意。我从一个网站获取html源代码，如下所示。 def get_soup(site): """get the html source for a web site""" try: logging.debug("Getting data from:" + site) req = urllib2.Request(site) req.add_header('Accept', '*/*') req.ad

浏览 1提问于2013-12-23得票数 0

3回答

bs4 BeautifulSoup -找不到看起来像是自定义标签的东西来拯救我的生命

、、

无可否认，我是Python的初学者到中级用户，并且是BeautifulSoup/web-scraping的新手。但是，我已经成功地构建了几个刮板。普通标签=没有问题(例如div、a、li等) 但是，我找不到如何使用.select或.find或attrs="“或任何内容引用此标记： .<react type="sad“msgid="25314120”num="2“.......... 我最终想要看起来像"num“属性的东西，不管这个可怕的东西是什么……一个"react“标签(尽管我不认为这是一件事？)？

浏览 0提问于2021-01-04得票数 0

1回答

当不满足条件时，无法让我的脚本继续尝试几次

、、、

我在python中创建了一个脚本，从网页的不同链接中获取某些帖子的标题。问题是，我尝试使用的网页有时不能给我提供有效的响应，但当我尝试两次或三次时，我确实得到了有效的响应。我一直试图以这样的方式创建一个循环，以便脚本将检查我定义的标题是否为空。如果标题是空的，那么脚本将继续循环4次，以查看它是否能够成功。但是，在对每个链接进行第四次尝试之后，脚本将选择另一个链接来重复相同的链接，直到所有链接都用完为止。这是我迄今为止的尝试： import time import requests from bs4 import BeautifulSoup links = [ "h

浏览 0提问于2019-06-07得票数 0

2回答

我是自顶向下编码，还是使用if name == "main“约定，这很重要吗？

我的大多数Python脚本(主要是为web抓取/数据科学应用程序编写的)都遵循这种格式： # import whatever packages import x, y, z # do some web-scraping and data manipulation # write some niche function I need # make some plots and basically end the script 这一切都是通过交互式编辑器/控制台(如Eclipse)完成的。我基本上编写了上面的代码，然后复制粘贴下面的代码进行测试。有没有更“标准”的方法来解决这个问题呢？我知

浏览 3提问于2016-02-12得票数 2

2回答

使用python进行网络抓取('NoneType‘对象不可迭代)

、、

我是python和web-scraping的新手。我正在尝试抓取一个网站(链接是url)。我收到一个错误"'NoneType‘object is not iterable"，下面的最后一行代码。有谁能指出可能出了什么问题吗？ import requests from bs4 import BeautifulSoup from urllib.parse import urljoin url = 'https://labtestsonline.org/tests-index' soup = BeautifulSoup(requests.get(url).c

浏览 3提问于2018-01-22得票数 0

1回答

如何从python抓取的URL列表中抓取数据？

、、、

我正在尝试使用Orange中的BeautifulSoup4从同一网站抓取的URL列表中抓取数据。当我手动设置URL时，我已经成功地从单个页面中抓取了数据。 from urllib.request import urlopen from bs4 import BeautifulSoup import requests import csv import re url = "https://data.ushja.org/awards-standings/zone-points.aspx?year=2021&zone=1&section=1901" req =

浏览 21提问于2021-07-23得票数 1

回答已采纳

4回答

用Python使用Selenium抓取文本值

、、、、

对于ERP系统中的每个供应商(供应商总数#= 800+)，我将收集其数据，并将此信息导出为pdf文件。我在Python中使用Selenium，创建了一个名为刮板的类，并定义了多个函数来自动化这个任务。函数gather_vendors负责抓取，并通过从标记元素中提取文本值来做到这一点。每个供应商都有一个叫做的部门。EFT Manager有9行是我要从其中提取的：对于#2和#3，两者都有字符串值(删除机密信息)。但是，#3返回null。我不明白为什么在要提取文本值时，#3继续返回null。每个元素的代码格式是相同的。我试着转换帧，但那不起作用。我试着从编辑模式中抓

浏览 1提问于2018-08-23得票数 0

回答已采纳

2回答

无法将代理和链接传递到线程池以获得结果

、、、

我用python编写了一个脚本，它使用代理、来抓取不同帖子的链接，遍历网页的不同页面。我试图从列表中使用proxies。脚本应该从列表中随机获取proxies，并向该网站发送请求，并最终解析项目。但是，如果任何proxy不起作用，则应该将其从列表中删除。我认为我在number of proxies和list of urls中使用ThreadPool(10).starmap(make_requests, zip(proxyVault,lead_url))的方式是准确的，但它不会产生任何结果；相反，脚本会被卡住。如何传递代理和指向ThreadPool的链接，以便脚本产生结果？ import r

浏览 1提问于2018-12-26得票数 2

回答已采纳

1回答

使用PromQL计算可用性

、、、

我将监控Kubernetes集群的可用性。普罗米修斯服务器抓取kube-apiserver指标，并根据kube-apiserver pods可用性计算可用性百分比。有时kube-apiserver pods关闭，Prometheus服务器根本无法抓取，有时pods启动并运行，也在为请求提供服务，但由于网络连接或任何其他原因，Prometheus服务器无法抓取指标。有没有什么方法可以使用PromQL来忽略任何值？或者更好的计算Kubernetes集群可用性的方法？

浏览 221提问于2020-06-22得票数 1

回答已采纳

1回答

如何在Excel或Python中为右列分配正确的值

、

最近，我使用Python抓取数据，并将数据导出到CSV文件。但后来我发现了一个关键的错误。由于我是Python的初学者，我试图找到过去的参考资料或一些材料，让我自己找出这一点，但没有。让我直说我的问题。例如，我的CSV文件如下所示： amenity_TV amenity_Wifi amenity_kitchen amenity_iron ... amenity_phone hotel_A TV Wifi kitchen iron ... phone hotel_B TV

浏览 2提问于2018-07-26得票数 0

回答已采纳

1回答

使用python脚本中的装饰器

、、

我用python编写了一个脚本，它能够收集帖子的链接，然后从目标页面中深入一层获取每个帖子的标题。我已经应用了@get_link装饰器，它从内部页面中抓取标题。 <#>However，我希望得到任何改进我现有方法的建议，因为我对使用它非常陌生，所以将装饰器保持在它的内部。 import requests from urllib.parse import urljoin from bs4 import BeautifulSoup url = "https://stackoverflow.com/questions/tagged/web-scraping" def

浏览 0提问于2018-12-06得票数 1

3回答

我如何在这个页面的下拉菜单中循环浏览每种产品的规格和价格？

、、、、

你好，我是Python和Web-scraping的新手。我正在尝试从这个页面(https://www.jmesales.com/kuriyama-3-4-in-brass-quick-couplings/)的下拉菜单中的每个产品选项中抓取数据。我相信页面不会使用JavaScript，我更愿意使用requests和BeautifulSoup，而不是webdriver。我有代码可以让我得到每个选项的名称和属性值，但我不确定如何访问与每个选项关联的定价和规范数据。这是我的代码： from urllib.request import urlopen from bs4 import Beautiful

浏览 34提问于2020-07-25得票数 0

1回答

运行脚本时，结果总是“未定义”。

、、、、

我一直在尝试使用axios和cheerio迭代地从网页中抓取下一个页面链接。当我运行脚本时，结果总是得到undefined。在没有更多的链接之前，我如何获得下一页链接？这是我目前的尝试： const axios = require("axios"); const cheerio = require("cheerio"); const base = "https://stackoverflow.com"; const url = "https://stackoverflow.com/questions/tagged/web-scrapi

浏览 3提问于2021-09-26得票数 1

回答已采纳

1回答

重置重复SPI调用的顺序扫描位置

、

我使用游标来获取数据。看起来是这样的： SPI_connect(); snprintf(sql, sizeof(sql), "SELECT * FROM %s;", dataTableName); cursorPlan = SPI_prepare(sql, 0, NULL); cursorPortal = SPI_cursor_open(NULL, cursorPlan, NULL, NULL, 1); SPI_cursor_fetch(cursorPortal, direction, CURSOR_BUFFER_SIZE); 在抓取之前，我执行 select * f

浏览 1提问于2013-08-19得票数 1

回答已采纳

2回答

使用Python2.7和selenium抓取数据并对其排序

、、

我正在尝试使用selenium和python2.7在网站上抓取数据。下面是我想刮掉的数据中的代码 <textarea>let, either, and, have, rather, because, your, with, other, that, neither, since, however, its, will, some, own, than, should, wants, they, got, may, what, least, else, cannot, like, whom, which, who, why, his, these, been, had, the, a

浏览 1提问于2018-12-19得票数 2

回答已采纳

3回答

无法在主文件夹中放置创建不同子文件夹的不同文本文件

、、、、

我用python编写了一个脚本，从网页中抓取不同帖子的前五个标题，然后将标题写到单个文本文件中，并将它们放在桌面文件夹DataStorage中的五个不同的子文件夹中。目前，下面的脚本可以解析五个帖子的标题，并将它们写入五个不同的文本文件中，并将它们放在桌面文件夹DataStorage中。如何在一个主文件夹中创建五个不同的子文件夹，并将文本文件放在有关子文件夹中？这是我迄今为止的尝试： import os import requests from bs4 import BeautifulSoup url = "https://stackoverflow.com/questions

浏览 1提问于2019-02-01得票数 1

回答已采纳

1回答

当我利用诺言时，返回结果会有困难。

、、、、

我在node中创建了一个脚本，使用promise与cheerio相结合，将links解析为来自网站的不同帖子的标题，然后通过重用这些links从其内部页面中抓取每个帖子的title。如果我在console.log($("h1 > a").eq(0).text());中取消了这一行的注释，我的当前脚本就可以相应地获取它们。但是，第二个函数似乎仍然没有返回任何内容。如何使脚本以现在的方式成功运行？到目前为止，我已经写到： const request = require('request'); const cheerio = require(

浏览 1提问于2019-04-14得票数 1

回答已采纳

3回答

从网页中提取数据到excel中，并在网页数据刷新时立即刷新。

、、、

我是python的新手，很想知道这一点。假设我想从一个网站上抓取股票价格数据，以获得更好的效果。现在数据每秒都在刷新，如何使用python自动刷新excel工作表中的数据。我读过关于win32的文章，但不太理解它的用处。任何帮助都将不胜感激。

浏览 28提问于2018-08-10得票数 0

1回答

不能区分这两个应该以相同方式工作的表达式

、、、

几天前，我创建了，以寻求任何解决方案，如何让脚本循环这样一种方式，以便脚本将很少使用链接来检查我定义的title (应该从每个链接中提取)对于four时间是否没有意义。如果title仍然是空的，那么脚本将break loop，然后再进行另一个链接以重复相同的链接。这就是我是如何获得成功的--通过将fetch_data(link)更改为return fetch_data(link)，并在while loop之外定义counter=0，但在if语句中定义counter=0，从而获得成功。更正脚本： import time import requests from bs4 import Beau

浏览 0提问于2019-06-09得票数 0

回答已采纳

2回答

如何清理此数据帧。我想使用python从表中删除"\n“，而不影响表

、、

我使用web-scraping将这个数据帧从网页中解析出来。使用的库有，bs4(BeautifulSoup)，pandas，requests和urllib。表必须以csv格式下载，以便之后在tableau中进行数据可视化。因此，在不影响任何行和列的情况下，我想从数据帧中删除"\n“。任何帮助都将在enter image description hereed上得到感谢。 ?

浏览 22提问于2020-08-30得票数 0

回答已采纳

1回答

为什么ListBlobsSegmentedAsync只返回第二页的结果？

、、

问题我试着拿一页多达5000块，没有前缀。这个集装箱里大约有26,000个水珠。我在第一页上一直没有得到任何结果，但是我注意到返回的BlobContinuationToken不是null，所以我可以再次页面并在第二个页面上获得结果。为什么在第一页上没有任何结果，但是在第二页上有结果呢？我希望能够做到这一点，并且只抓取一页： var response = await container.ListBlobsSegmentedAsync(null).ConfigureAwait(false); 但是这不返回任何结果，因此，我必须再次调用它，传入continuationToken，此时我确实得到了

浏览 2提问于2016-01-29得票数 2

回答已采纳

1回答

Paramiko SSHClient.connect返回False

、、、

我试图用Python打开到路由器的SSH连接，经过多次尝试而没有任何输出后，我发现当我为SSHClient.connect打印一个真/假比较语句时，我总是得到假的，我尝试了很多事情，但是没有结果！我编写的Python脚本非常常见，但结果一点都不(请注意，我尝试通过SSH访问不同的网络设备，但尚未建立连接) ssh = paramiko.SSHClient() success = ssh.connect(hostname="172.16.0.1", username="admin", password="admin") if (success !

浏览 3提问于2022-10-30得票数 1

1回答

Node和JSDOM:似乎无法抓取URL响应

、、、

我正在尝试使用JSDOM进行抓取，但在抓取站点时遇到了问题。我正在使用Axios，并且我测试了控制台记录resp，它可以正确地返回，但当我在它上面使用JSDOM时，我似乎无法从它获得任何值。我正在使用document.querySelector(".cd__headline").textContent测试它，我知道它应该返回一个字符串值，但我一直得到cannot call textContent on null。 scrape: async function() { try { const resp = await axios.get(&

浏览 5提问于2021-03-14得票数 1

1回答

相当于Python在Go中的HTML解析函数/模块？

、、、

我现在正在学习Go自己，并且被困在获取和解析HTML/XML中。在Python中，我通常在进行web抓取时编写以下代码： from urllib.request import urlopen, Request url = "http://stackoverflow.com/" req = Request(url) html = urlopen(req).read() ，然后我可以以string或bytes的形式获得原始的HTML/XML，然后继续使用它。在围棋中，我该如何应对呢？我希望得到的是原始的HTML数据，这些数据存储在string或[]byte中(虽然可以很容易地转换，

浏览 5提问于2013-09-03得票数 0

回答已采纳

3回答

Python硒多处理

、、、、

我用python和selenium结合编写了一个脚本，从它的登陆页面中抓取不同帖子的链接，并通过跟踪指向其内部页面的url最终获得每个帖子的标题。虽然我在这里分析的内容是静态的，但我使用selenium来查看它在多处理中的工作方式。然而，我的意图是使用多处理进行抓取。到目前为止，我知道selenium不支持多处理，但我似乎错了。我的问题:当使用多进程运行时，如何减少使用selenium的执行时间？ This is my try (it's a working one) import requests from urllib.parse import urljoin from mul

浏览 2提问于2018-11-26得票数 31

回答已采纳

3回答

Python错误：'NoneType‘对象没有使用Beautiful Soup的属性'find_all’

、、

我在运行一些网络抓取代码时遇到了问题。要从一系列链接中抓取信息，如下所示： http://www2.congreso.gob.pe/Sicr/TraDocEstProc/CLProLey2006.nsf/ec97fee42a2412d5052578bb001539ee/89045fe8ae896e2e0525751c005544cd?OpenDocument 我正在尝试从表中抓取某些元素，但收到以下错误： Python Error: 'NoneType' object has no attribute 'find_all' 我知道这与它实际上没有找到表有关，因

浏览 44提问于2020-04-18得票数 1

回答已采纳

1回答

运行Python脚本从CNN抓取新闻报道时没有输出

import requests from lxml import html page = requests.get('http://www.cnn.com') html_content = html.fromstring(page.content) for i in html_content.iterchildren(): print i news_stories = html_content.xpath('//h2[@data-analytics]/a/span/text()') news_links = html_content.xpath(&

浏览 7提问于2016-12-04得票数 1

回答已采纳

1回答

Python SQL查询执行

、、

我尝试运行一个SQL查询来执行表和添加列之间的查找，并在SQL中更新新表中的结果，然后将新表传递到pandas数据帧中。但是当我执行的时候，我得到了下面的错误： “ File "C:\Users\Sundar_ars\Desktop\Code\SQL_DB_Extract_1.py", line 27, in <module> df1 = pd.read_sql(Sql_Query,conn) File "C:\Users\Sundar_ars\AppData\Local\Programs\Python\Python39\lib\site-packag

浏览 0提问于2021-10-24得票数 0

1回答

无法摆脱不必要的输出

、、、

我用re模块用python编写了一个脚本，以便从网页中获得不同问题的标题。我在这里的意图是不使用BeautifulSoup，并且仍然能够解析标题。我用模式的方式可以做到这一点。但是，输出看起来不太好。我怎么能只得到问题的标题而没有别的。下面是我的尝试(使用re.search())： import requests import re link = "https://stackoverflow.com/questions/tagged/web-scraping" res = requests.get(link).text for item in res.splitlines

浏览 0提问于2018-07-08得票数 1

回答已采纳

1回答

表为空时不返回空的Yii查询

、、、、

我有一个空表tbl_rating，其中包含user_id和post_id列。在我的Post视图中，我试图检查查看的帖子是否已经被查看的用户评级了。我在视图中使用了以下内容。 <?php $sql='SELECT * FROM tbl_rating WHERE post_id='.$model->id.' AND user_id='.Yii::app()->user->getId().';'; $connection=Yii::app()->db; $command=$connectio

浏览 2提问于2013-10-18得票数 0

回答已采纳

2回答

如何在使用python向下滚动时刮掉提供更多信息的html页面

、、

我正在从上抓取课文。但是我不能抓取页面中位于“总计”表下面的内容。我想从“总计”和“高级”表中得到数字，但是代码没有返回任何内容。当用户向下滚动页面时，该页面似乎会加载其他信息。我运行了下面的代码，并成功地从玩家的个人资料部分和“每个游戏”表中获得数据。但无法从“总计”表中获得值。 from lxml import html import urllib playerURL=urllib.urlopen("https://www.basketball-reference.com/players/p/parsoch01.html") # Use xpath to parse po

浏览 2提问于2019-07-27得票数 0

回答已采纳

1回答

如何使用python请求登录本网站？

、、

我对Python和web-scraping不熟悉。我甚至不能实现抓取网站的第一步:登录。在我尝试使用mechanize或selenium之前，我想先使用requests。有人能帮我吗？我一直在尝试登录的网站是。对于那些没有账户并想要帮助我的人，我会提供我通过使用Chrome获得的信息。第一篇文章：。第二篇文章：下面是我尝试登录的代码： import requests s = requests.Session() headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWe

浏览 17提问于2017-07-11得票数 5

回答已采纳

3回答

从PHP的shell_exec调用wget不起作用

、、、

我正试图在本地运行一个PHP脚本，它用wget抓取谷歌并将其转储到temp.html中。从终端运行此命令效果很好： wget -O temp.html http://www.google.ca 从PHP运行此命令也可以正常工作(因此这不是权限问题)： shell_exec('touch temp.html'); 但是在PHP中运行不起作用(不会创建temp.html)： shell_exec('wget -O temp.html http://www.google.ca'); 有什么建议吗？将最后一条命令包装在var_dump()中会输出null。谢谢!

浏览 2提问于2017-08-11得票数 0

2回答

空的Http调用，但没有错误

、

我试图用我的应用程序调用一个get服务，但是没有得到错误，URL是正确的，并且返回了一些东西(通过浏览器)，但是我没有得到任何内容。 try { HttpClient httpclient = new DefaultHttpClient(); HttpGet httpget = new HttpGet(url); HttpResponse response = httpclient.execute(httpget); HttpEntity entity = response.getEntity(); int lenght = (int) entity.g

浏览 1提问于2012-07-26得票数 0

2回答

了解Python 3列出了为每个元素打印None值

、、

作为Python中的新手，我在版本3中打印列表的所有元素，经过全面的研究后，我找不到对这种行为的解释。然而，我知道每个函数都必须返回一些值，当它没有定义时，函数返回"Null“(或者Python中的"None”)。但是为什么在这种情况下，在正确打印所有元素之后，它会为另一个列表中的每个元素打印"None“？ >>> a_list = [1,2] >>> a_list [1, 2] >>> [print(f) for f in a_list] 1 2 [None, None]

浏览 0提问于2013-07-18得票数 5

回答已采纳

1回答

哪些操作可以并行进行而不需要抓取GIL？

、、

我正在研究如何将Python嵌入到多线程C++程序中，并使用numpy并行地进行简单的计算。换句话说，我使用PyRun_SimpleString来调用numpy函数。如果我只写入现有的numpy数组，并且注意不要从不同的线程修改相同的数组，那么是否需要抓取GIL？正如评论中提到的，编辑在这里讨论了这个问题：一个可能的解决方案是直接使用ctype使用numpy c接口，它负责释放GIL：。对于后人来说，下面是当您尝试在不抓取吉尔的情况下执行"a*=2“时所发生的事情： Program received signal SIGSEGV, Segmentation fault. 0x0

浏览 0提问于2014-10-18得票数 2

回答已采纳

3回答

链接Python文件帮助

我知道如何实际链接python文件，然而，我不知道如何从这些链接文件中获取变量。我试着抓取它们，但我一直在抓取NameError。我该怎么做呢？我想链接文件的原因是简单地整理我的脚本，而不是让它长达10000000000行。另外，在导入的python脚本中，我必须重新导入所有内容吗？另一个问题是，当我使用其他脚本函数时，我是否使用self函数？即：主脚本： import sys, os import importedpyfile 导入的Py文件 import sys, os

浏览 0提问于2013-01-13得票数 1

回答已采纳

1回答

JPA:如何避免急切获取的超时问题

、、

我正面临着JPA的情况。我有一个实体，假设A.A与itself.So有父子关系A可以有A(子代)的集合，并且A(父代).If父代为null，这意味着A是层次结构的根节点。我的用例是，我需要获取表中的所有数据(大约30k-40k行)，然后根据实体之间的父子关系将其组织到树结构中。所以我决定为Collection字段设置一个即时抓取，这样JPA就会自己在所需的树形结构中抓取数据，而且它工作得非常好。但在其他用例中，不需要获取A的整个数据，而且当有太多数据时，也会导致超时问题。那么我该如何解决这个问题呢？我计划将两个实体映射到表中，一个具有渴望的策略，另一个具有惰性的策略。因此，我会在我的用

浏览 2提问于2016-03-10得票数 0

2回答

将多个数据从网页导入Google工作表

、、、、

我正在创建一个包含大量库存项目的股票表。每只股票都有多个数据，我正在从多个网站抓取这些数据。目前，由于我的工作表一直在增加，我开始在执行IMPORTXML和IMPORTHTML函数时遇到麻烦。问题:比方说，可以将整个网页的源导入一个单元格，然后我可以运行我的IMPORTHTML/IMPORTXML ，将该单元格作为源？，我正在考虑这个问题，因为在这种情况下，我只需调用特定页面一次，并且只需处理工作表本身内的所有不同数据。任何想法都将不胜感激，泰斯！

浏览 3提问于2020-08-23得票数 0

回答已采纳

1回答

Python - facebook擦除返回一个空的json文件

、、

我第一次尝试用Python抓取facebook的数据，通过一些视频课程。我有以下代码： import os import json import facebook import requests if __name__ == '__main__' : token = os.environ.get('FACEBOOK_TEMP_TOKEN') graph = facebook.GraphAPI(token) posts = graph.get_connections('me', 'posts')

浏览 0提问于2018-03-14得票数 0

1回答

从BSON文件创建配置单元表时列值变为NULL

、、、、

我从MongoDB (4.0).After的BSON文件转储创建了一个蜂窝(3.1.2)表。创建该表时，我从表中选择了几个条目。但是，它们中的一些值为空。我尝试使用python打印来自BSON的表行。它打印的值是正确的。表示没有丢失的值。有关于如何进一步解决问题的线索吗？用于创建配置单元表的SQL。 CREATE EXTERNAL TABLE `tmp_test_status`( `id` string COMMENT 'frame_id', `createdAt` INT, `updatedAt` string, `task` string) ro

浏览 3提问于2019-05-29得票数 0

回答已采纳

1回答

如何创建Django对象，其中外键字段引用在不包含数据的字段上

、、、、

我在创建django对象时遇到了问题。我有两个型号 class League(models.Model): league_id = models.IntegerField(primary_key=True) league_name = models.CharField(max_length=20) league_logo = models.URLField(null = True) league_flag = models.URLField(null = True) standings = models.IntegerField(null=

浏览 4提问于2019-11-03得票数 0

2回答

避免在引用表中不存在记录时返回包含MAX和MIN的null

、、

我使用了一个临时表(TEMP_PERIODS)，在这个表中我存储了周期以及开始和结束时间间隔。当用于填充TEMP_PERIODS的查询使用值填充目标表时，一切都按预期工作，但是，当我没有任何数据时，下面的select将返回空值： SELECT min(FROM), max(TILL) FROM TEMP_PERIODS WITH UR; 返回 1 2 ---- ---- NULL NULL 未返回任何记录的select： SELECT * FROM TEMP_PERIODS WITH UR; 一种可能的解决方案是在计数器为0时避免最小最大选择： SELECT count(

浏览 14提问于2019-08-03得票数 0

1回答

在以某种自定义方式使用concurrent.futures时无法打印函数的结果

、、、

我使用concurrent.futures库创建了一个脚本来打印来自fetch_links函数的结果。当我在函数中使用print语句时，就会得到相应的结果。我现在想要做的是使用产额语句打印该函数的结果。是否有任何方法可以修改main函数下的内容，以便打印fetch_links函数的结果--保持原样，意思是保留result语句？ import requests from bs4 import BeautifulSoup import concurrent.futures as cf links = [ "https://stackoverflow.com/questions/

浏览 1提问于2020-10-12得票数 0

回答已采纳