python爬去天气_python 爬天气_python 爬取天气 - 腾讯云开发者社区

数据挖掘、python、api、twitter、数据

由于现在Twitter API 数据爬取付费，所以我想在不使用Twitter API的情况下使用python爬取到特定关键词的Twitter数据或者Reddit数据，有什么好办法吗？

浏览 350提问于2024-01-06

1回答

已安装但未识别的PyOWM？

python、pip、weather、openweathermap

免责声明-我对Python非常陌生。我想使用OWM API来制作一个简单的Python天气程序。我找到了一些在网络上使用这个密钥的指南，他们说要使用PyOWM库。我DuckDuckGoed如何安装它，我下载了Pip。我把它放在C:/pip中，并尝试运行‘pythonget-pip.py’(是的，我在CMD中的目录中)。它没有工作，它将我发送到Python的Microsoft页面。我安装了它(尽管我安装了正常的ver )，然后再试一次。已安装Pip。我运行pip pyowm并安装了它。一切看起来都很好。当我回到PyCharm的时候，它是行不通的。这是我正在看的教程中的代码： import

浏览 3提问于2020-05-27得票数 2

回答已采纳

1回答

从IPython执行python文件

ipython、ipython-notebook

我对NumPy/SciPy和IPython比较陌生。要在python交互模式下执行python脚本，我们可以使用以下命令。 >>> import os >>> os.system('executable.py') 然后，可以从python提示符中看到打印输出。但同样的想法并不适用于IPython笔记本电脑。 In [64]: import os os.system('executable.py') Out[64]: 0 在这种情况下，我看不到任何打印输出。笔记本只告诉天气执行成功与否。当我使用IPython笔记本时，有

浏览 3提问于2015-12-18得票数 1

回答已采纳

1回答

试图利用格兰杰因果关系。不确定如何解释输出

r、time-series

我有两组时间序列数据，动物园[6826 500 2050 5353 79 27 22 89 123 228 1647 1541 290 296 .....]的游客人数天气情况资料(雨量、雨、雪、雾等的1/0变量) [0 86 41 0 0 0 0 0 0 0 196 0 0 43 18 0 8 23 38 0 58 .....] 我试图用R中的lmtest软件包来检验格兰杰因果关系，以确定天气数据对游客数量的影响。在下面的代码中，我测试了降水数据。 gran

浏览 1提问于2015-03-24得票数 1

1回答

Scrapy Flight搜索

python、web-crawler、scrapy

我正在尝试使用Python中的Scrapy在一些航班上运行航班搜索，然后将其导出为csv。这只是为了好玩，因为我对Scrapy有了更多的了解。这是我所拥有的 from scrapy.item import Item, Field from scrapy.http import FormRequest from scrapy.spider import Spider class DeltaItem(Item): title = Field() link = Field() desc = Field() class DmozSpider(Spide

浏览 1提问于2015-04-17得票数 0

1回答

如何用python爬取数据并保存到excel？

python

利用python爬取豆瓣电影排行榜（https://movie.douban.com/chart)的数据并保存到excel中。用相同代码爬取网页豆瓣top250的数据可以爬取到excel中，但将网址及相关信息改为网页豆瓣电影排行榜中的信息时便无法爬取，也找不出问题所在。以下图片为完整代码。 590859A8-9A1A-4E52-8E60-AD292B16B4A8.png 655C6D0E-4901-4369-AA98-452F9FEFB852.png 4E73A31E-C9C4-45C0-A34E-8EA9AE335A98.jpeg 91321020-9B32-4C77-910A-FA

浏览 315提问于2021-01-09

1回答

是否可以使用触发器创建列？

sql、sql-server、key-value、entity-attribute-value

作为实体-属性-值或键-值对表等反模式的替代方案，是否可以通过参数表上的INSERT触发器将列动态添加到数据表中？下面是我的表格： CREATE TABLE [Parameters] ( id int NOT NULL IDENTITY(1,1) PRIMARY KEY, Parameter varchar(200) NOT NULL, Type varchar(200) NOT NULL ) GO CREATE TABLE [Data] ( id int NOT NULL IDENTITY(1,1)

浏览 1提问于2012-12-20得票数 0

回答已采纳

1回答

SharePoint2010 search中的索引数据库和属性数据库有什么不同？

search、sharepoint-2010

SharePoint2010 search中的索引数据库和属性数据库有什么不同？

浏览 5提问于2011-02-15得票数 0

回答已采纳

2回答

使用PHP获取javascript获取的值

javascript、php、facebook、facebook-graph-api

我能够从social Graph API中提取用户信息，并将其显示在我的网站上的标签中。现在如何获取此信息，并在PHP脚本中使用它？换句话说，假设我想使用PHP来计算天气，但仅基于用户facebook配置文件上的首选天气(假设情况)。现在，假设我已经使用javascript获得了用户喜欢的天气，我如何使用PHP来获取这些信息来执行我的计算呢？我猜一种方法是使用正则表达式来匹配同一页面上的值，但这似乎很繁琐。任何帮助/指导都将不胜感激。

浏览 0提问于2011-04-09得票数 0

回答已采纳

2回答

pvlib-python如何从全球模式(GFS)中检索长达一年的存档天气预报？

unidata、pvlib

我已经看到了pvlib-python获取天气预报是多么容易，就像这个链接所示：在这个链接中，这个例子只是为了说明，检索到的天气数据似乎长度有限(不超过过去一个月)。因此，我想知道pvlib为实际实现检索的存档天气预报是否可以更长。 pvlib-python可以检索一年的GFS天气预报吗？例如，我正在查找整个2018年的温度和太阳辐射(GHI)。pvlib-python可以做到这一点吗?如果可以，又是如何做到的呢？

浏览 5提问于2019-02-23得票数 1

1回答

刮伤:未处理的错误

python、scrapy

我的刮刀用了大约一个小时。过了一会儿，我开始看到这些错误： 2014-01-16 21:26:06+0100 [-] Unhandled Error Traceback (most recent call last): File "/home/scraper/.fakeroot/lib/python2.7/site-packages/Scrapy-0.20.2-py2.7.egg/scrapy/crawler.py", line 93, in start self.start_reactor() F

浏览 3提问于2014-01-16得票数 3

3回答

如何使新的网站索引和排名由Alexa？

traffic、ranking、alexa

当我在Alexa上搜索我的网站时，上面写着"Alexa流量等级:没有数据“。我已经读过，要获得一个网站的索引，你必须点击“爬我的网站”在网站管理员的网页。然而，没有一个链接说“爬行我的网站”。那么，到目前为止，一个人如何得到一个由Alexa索引的网站，以便我的流量排名将显示在Alexa索引中？

浏览 0提问于2011-07-29得票数 4

1回答

谷歌网站地图和Robots.txt问题

sitemap、robots.txt

在我们的网站上有一个网站地图网站管理员中心报告说，网站地图中的一些urls被我们的robots.txt屏蔽了，请看，！尽管这些urls在Robots.txt中并不是不允许的。还有其他类似的网址，例如，gamezebo.com/gamelinks出现在我们的网站地图中，但它被报告为“robots.txt限制的网址”。另外，我在站长中心有一个解析结果，上面写着：“第21行:爬行延迟: 10规则被Googlebot忽略”。什么意思？我很感谢你的帮助谢谢。

浏览 3提问于2009-09-28得票数 1

1回答

使用Databricks将Google的结果写入一个数据湖

python、apache-spark、azure-data-lake、databricks、google-api-python-client

我正在通过Databricks上的Python从获得用户使用数据。数据大小约为每天100 000条记录，这是我通过一个批处理的晚上做的。api返回的最大页面大小为1000，因此我将其命名为1000，以获得当天所需的数据。这很好用。我的最终目标是将数据以其原始格式存储在一个数据湖中(Azure Gen2，但与这个问题无关)。稍后，我将使用Databricks将数据转换为聚合报告模型，并将PowerBI放在上面，跟踪Google的使用情况。作为一名C#程序员，我对Python很陌生:我目前的方法是从api请求1000个记录的第一页，然后将它直接作为JSON文件写入datalake，然后获取下一

浏览 0提问于2019-04-11得票数 2

回答已采纳

1回答

已暂停爬网问题的计划增量爬网行为

sharepoint

快速问一下，我错误地开始了对我的一个内容源的增量抓取。然后我暂停了它，这样它就不会影响用户了。它将在下一次计划的增量爬网时恢复还是需要手动恢复？

浏览 12提问于2019-12-20得票数 0

1回答

如何使用python- telegram -bot将消息发送到电报通道

python、telegram、telegram-bot、python-telegram-bot

我创建了一个电报机器人，并将其添加到我的电报频道中。现在，当我的python程序中发生一些事情时，我想使用它向我的通道发送消息。例如，我有一个每15秒检查一次天气的python程序，当天气发生变化时，我希望我的机器人将新的天气信息发送到我的电报频道。所以我的问题是，我该怎么做呢？我被困住了，因为python-telegram-bot需要来自用户的一条消息来触发，或者一个预定的订单，而我不能安排它，因为我不知道什么时候天气会改变。

浏览 2提问于2021-03-13得票数 1

3回答

如何在AccuWeather中获取城市代码天气？

weather

有没有人用过AccuWeather搜索你国家的天气？我想在AccuWeather中获取我的城市天气代码，谁能帮我？生成的代码格式如下: EUR|DE|GM014|TORGAU。我找不到我的城市代码(柬埔寨金边)

浏览 1提问于2012-09-17得票数 6

回答已采纳

1回答

如何使用python添加开放式天气图的天气图1.0？

python-3.x

如何使用python添加开放式天气图的天气图1.0？https://openweathermap.org/api/weathermaps

浏览 48提问于2019-09-17得票数 0

0回答

基于Python的股票数据爬取？

python、爬虫、正则表达式、微信

使用Python语言编写爬虫程序，使用正则表达式将指定日期时段内的全部上市公司股票数据爬取下来，并按照股票代码保存到相应的Excel文件中。有偿联系微信：15527440125

浏览 190提问于2020-05-23

1回答

Nutch Crawler读取分段结果

apache、nutch、web-crawler

我使用apache-nutch-crawler1.6进行爬行。在爬行之后，当我尝试使用命令读取爬行结果的内容时 bin/nutch readseg -dump crawl/segments/* segmentAllContent 错误是 Exception in thread "main" org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file:/home/ubuntu/nutch/framework/apache-nutch-1.6/blogs/segments/20

浏览 0提问于2013-06-21得票数 1

1回答

即使网址从seed.txt中删除，网站也会被爬行(Nutch2.1)

nutch、web-crawler

我在seed.txt中用url-1成功地执行了一次爬行，我可以在MySQL数据库中看到爬行的数据。现在，当我尝试通过在seed.txt中用url-2替换url-1来执行另一次新的爬行时，新的爬行开始于抓取步骤，并且它试图抓取的url是seed.txt中旧的替换的url。我不确定它是从哪里拿到这个旧网址的。我尝试检查隐藏的种子文件，但没有找到，并且在我运行爬网命令的NUTCH_HOME/ run /local中只有一个文件夹urls/seed.txt。请告诉我可能是什么问题？

浏览 1提问于2013-04-17得票数 1

3回答

当添加新页面时，Nutch会自动抓取我的站点吗？

nutch

当我向网站添加新页面时，会自动爬网吗？

浏览 4提问于2009-11-25得票数 0

1回答

使用Scrapy爬网时出现异常错误

python、scrapy

我开始测试Scrapy以便抓取一个网站，但当我测试我的代码时，我得到一个错误，我似乎不知道如何解决。以下是错误输出： ... 2012-12-18 02:07:19+0000 [dmoz] DEBUG: Crawled (200) <GET http://MYURL.COM> (referer: None) 2012-12-18 02:07:19+0000 [dmoz] ERROR: Spider error processing <GET http://MYURL.COM> Traceback (most recent call last): F

浏览 2提问于2012-12-18得票数 0

回答已采纳

1回答

sharepoint 2007搜索爬网

sharepoint-2007

我的问题是:我有sharepoint 2007 web应用程序和windows server 2008操作系统。我在SharePoint2007中做搜索，它工作得很好。最近我添加了一个新的网站页面，但它没有出现在搜索结果中。我也在爬虫日志中查找了它，但我没有找到页面的url。新信息当我切换到windows身份验证时，一切都很好，页面是在搜索process.but中找到的，切换回表单身份验证不会使网页出现在搜索结果中。我的问题是:如何让新页面出现在搜索结果中？

浏览 1提问于2013-01-31得票数 0

1回答

用Python从meteofrance.com抓取天气报告

python、web-scraping、jwt

目标：从抓取天气报告使用的工具：Python (BeautifulSoup、requests等) Problem：天气报告似乎只有在传递JSON令牌(JWT)的身份验证之后才可用。实际上，我不知道如何使用Python库获得这个令牌。换句话说，在发出GET请求之前，我是否需要创建一个会话或类似的东西？

浏览 1提问于2020-08-17得票数 1

1回答

如何将外部api的响应传递给watson会话中的对话框？

python、ibm-watson、watson、watson-conversation

我正在用沃森的对话api构建一个天气机器人。每当用户发送“天气是什么”时。我得到了一个意图和实体的回应。现在我给天气api打了个电话，得到了一个响应。如何将此天气响应传递回要显示的watson对话框？我认为我必须通过上下文对象发送响应，但是如何调用会话api来传递响应呢？我正在使用python。

浏览 4提问于2017-04-19得票数 1

回答已采纳

2回答

如何从复杂的JSON API返回嵌套值

python、json、api-design

我正在设置一个天气摄像机，它将提供当前外部条件的实况流，但我也想覆盖来自当地国家气象局气象站的持续更新的天气条件(温度，风速/方向，当前天气)，来自以JSON格式提供的浏览器API源。我已经成功地使用我编写的Python脚本从不同的API源中提取了所需的值；不管说来话长，API源都是不可靠的。因此，我使用的API从官方国家气象局ASOS站在我附近的机场。然而，我正在轮询的新API源代码的输出相当复杂，具有不同的缩进层次。我使用Python的时间不长，在线教程和指南要么是针对其他语言(主要是Java或C++ )的，要么是没有针对我的特定案例的。首先，这是我收到的JSON的结构： ?

浏览 53提问于2018-12-20得票数 1

回答已采纳

2回答

大神有没有研究过美团的_token生成方法？

python、爬虫、数据分析

如题，我最近在做一个数据分析，想要用到美团的美食信息，于是就想用python爬取美团的数据，但是在构造爬虫的时候发现美团有一个_token参数，百思不得其解，还请大神指教

浏览 2207提问于2018-09-12

2回答

将MQTT主题和消息放在数组中

python、mqtt

我对python完全是新手，有非常基本的MQTT知识。我正在尝试编写一个python脚本，它订阅通配符主题，然后在通配符下构建主题列表。我知道MQTT协议不适合这一点，所以我需要通过python来完成这个任务。我正在考虑将主题和消息放在一个数组中。我有以下主题： /天气/电流/温度 /天气/电流/湿度 /天气/电流/压力 /天气/当前/时间在我的python脚本中，我订阅了/气/current/#。例如，我想数组应该是这样的： /天气/当前/温度，信息 /天气/当前/压力、信息我的脚本就是一个标准的例子，在这个例子中，我尝试了几种方法来实现这一点，但是失败了。我认为我

浏览 0提问于2014-03-26得票数 0

回答已采纳

1回答

SharePoint 2010 search中的爬网程序影响规则和爬网规则有何不同？

sharepoint、search、sharepoint-2010

SharePoint 2010 search中的爬网程序影响规则和爬网规则有何不同？

浏览 1提问于2011-02-13得票数 4

回答已采纳

1回答

如何使MOSS 2007我的站点配置文件字段不作为可搜索链接？

sharepoint、search、sharepoint-2007、profile、mysite

我有一个MOSS 2007实例，其中我的客户希望我的网站配置文件中的内容不显示为链接。我们如何才能做到这一点？我尝试从SSP中删除首选搜索中心url。它做到了这一点，但它也打破了位于页面右上角(欢迎菜单下方)的标准搜索功能。

浏览 1提问于2009-09-28得票数 0

1回答

对于日期值，SharePoint 2013“查找项目”搜索返回null

sharepoint、sharepoint-2013

微软SharePoint 2013。我有一个任务列表，其中有一些日期列。每当我尝试在列表上方的Serach框中搜索日期值时，我都得不到任何项目。其他值在搜索框中工作正常。请帮帮我。未启用内容审批

浏览 10提问于2019-04-16得票数 0

1回答

如何隐藏我的IP在python中进行网络抓取？

python、web-scraping、ip、tor

我正在用python在一些页面上做web抓取，我已经被其中的一些阻止了。当我试图通过TOR浏览器检查它时，我已经看到我无法访问页面，所以我认为这些页面已经能够跟踪我所有的IP或我没有很好地配置TOR (我认为不是因为我用Chrome和TOR检查了我的IP地址和TOR是不同的)，所以，有人知道为什么吗？此外，我正在尝试在我的python代码中执行一个函数或方法来自动更改mi IP。我所看到的是，最好的方法是通过TOR浏览器(将其用作从页面获取数据的搜索引擎)，但我无法使其工作。你对创建这个函数有什么建议吗？谢谢!

浏览 19提问于2020-05-21得票数 2

回答已采纳

1回答

在SharePoint online库中查找最近添加的文件

microsoft-graph-api、onedrive

我的要求是使用图形apis在我的整个SharePoint Online (SPO)中搜索文件。我在MS Graph Explorer中使用的查询如下所示： domain'.sharepoint.com/_api/search/query?Querytext='res1a2b3c4d5e‘ 基本上，上面的查询是搜索标题/名称为'res1a2b3c4d5e‘的所有文档。如果我搜索任何现有的文档，这将很好地工作。如果我试图搜索在进行上述调用之前创建/上传的任何文档，我将不会得到结果。如果我在几分钟后搜索相同的内容，则请求成功。当我在我的客户站点上尝试相同的内容时，它有数百

浏览 2提问于2017-04-18得票数 1

1回答

在应用程序从chroot调用的上下文中访问来自linux内核驱动程序的绝对文件路径

module、path、kernel、absolute、chroot

Linux驱动程序问题。我有一个应用程序有效地调用我的内核模块。在从应用程序调用期间，内核模块必须从特定的绝对路径读取文件。这一切在正常情况下都工作得很好。当应用程序从chroot运行时，就会出现问题。此时，在从chroot运行的应用程序的上下文中运行时，我的驱动程序不再能够访问它必须读取的文件的绝对路径。驱动程序使用filp_open()打开文件，当应用程序从chroot运行时会失败。有没有办法让我指定要打开的文件的根目录，而不会干扰应用程序的chroot，或者引起与访问chroot中其他文件的应用程序的竞争。 Linux版本是centos 7.1 kernel 3.10.0-229

浏览 6提问于2018-04-26得票数 0

2回答

如何使用Python在需要Google帐户登录的网站上进行web爬行？

python、web-crawler

我是Python的新手，我想使用Python来抓取几个需要Google帐号登录的网站。例如，我想爬一个网站xxx.appspot.com，我需要登录我的谷歌帐户访问它，因为这个数据库需要验证，我是授权人员。当我做这样的事情： content=urllib.urlopen(target_url).read() 当然，我得到的“内容”只是一个登录页面。如何实现代码，以便爬虫在实际爬行之前可以在Google帐户中签名。

浏览 1提问于2013-12-18得票数 2

回答已采纳

2回答

Scrapy代码无法接受Python脚本中的参数

python、scrapy

我正在尝试在Python脚本中运行Scrapy。相关代码如下： import scrapy from scrapy.crawler import CrawlerProcess class PostSpider(scrapy.Spider): name = "post crawler" allowed_domains = ['test.com'] def __init__(self, **kwargs): super(PostSpider, self).__init__(**kwargs) url =

浏览 0提问于2016-03-25得票数 2

1回答

从某些论坛抓取数据时，我不断收到错误

python、json、dataframe、web-crawler

我想从论坛上得到信息，Dcard。我还构建了一个函数来排列我收到的数据。 import json import pandas as pd import requests from requests_html import HTML import re import openpyxl def Crawl(ID): link='https://www.dcard.tw/_api/posts/'+str(ID) requ=requests.get(link) rejs=requ.json() return(pd.Da

浏览 11提问于2021-07-30得票数 0

1回答

Raspberry Pi tkinter应用程序从脚本运行时空白屏幕，直接从终端运行时工作正常。

python-3.x、tkinter、raspberry-pi、raspbian

我已经为Raspberry pi 0创建了一个使用Python和tkinter的天气预报显示应用程序。该应用程序使用请求从天气api中提取天气信息，并使用图像和标签显示天气预报。我使用python3 ./myappname.py运行这个应用程序，一切都很好。我希望这个应用程序自动显示时，每当覆盆子Pi重新启动。因此，我正在编写一个bash脚本来启动应用程序。下一步是使用cron或autostart在启动时运行bash脚本。我用以下代码创建了一个脚本： /bin/sleep 10 && /usr/bin/python3 /home/pi/myappname.py 我正在使用sh

浏览 12提问于2022-01-20得票数 -1

回答已采纳

3回答

如何解释逆变器的功率值？

javascript、web-services

我正在测量一个逆变器目前正在生产的电源，我显示三个不同的图标。如果逆变器能产生最多5000 W，我的范围可能是这样的：<1.500 ->云，<3.500 ->部分多云，>=3.500 ->太阳。这种方法有一个很大的缺点，因为天气、一年中的时间和一天中的时间会影响发电。有没有一个网络服务可以告诉我本镇当前的天气情况？据我所知，每年的时间如何改变这三个范围？干杯!

浏览 2提问于2013-09-28得票数 0

回答已采纳

2回答

在虚拟机上运行python程序

scrapy、google-compute-engine

我创建了GCP虚拟机(ubunto)。我安装了python和scrapy。我想从那里运行我的蜘蛛，scrapy crawl test -o test1.csv我从gcp打开终端并运行蜘蛛(工作)，这将需要至少3个小时。如何确保在退出终端(浏览器)时脚本将继续执行。

浏览 23提问于2019-08-31得票数 1

回答已采纳

1回答

如何控制vim中新缓冲区的位置

vim、plugins、buffer

我用python编写了一个vim插件来获取天气信息，我使用print来打印天气信息，所有的核心代码都封装在一个函数Weather()中。当我在vim中调用此函数时，天气信息将显示在当前缓冲区下的一个新缓冲区中，我可以在当前缓冲区的左侧或任何其他位置控制这个新缓冲区吗？

浏览 1提问于2013-10-30得票数 1

2回答

使用python查找重复文件

python、file、duplicates、directory、web-crawler

我正在尝试写一个Python脚本，它将在目录中爬行，找到所有重复的文件并报告重复的文件。解决这个问题最好的办法是什么？ import os, sys def crawlDirectories(directoryToCrawl): crawledDirectory = [os.path.join(path, subname) for path, dirnames, filenames in os.walk(directoryToCrawl) for subname in dirnames + filenames] return crawledDirectory #print

浏览 1提问于2012-09-24得票数 1

1回答

Python端字符串计数器

python、url、extract、counter

我回到了Python中的一个旧项目，但我似乎忘记了我是如何提取数据的，如果有人能为我指出正确的方向和文档来实现这一点，我将不胜感激。我实现了一个web爬虫，它通过扫描我的HTML代码从html页面中提取信息。使用我使用过的BeautifulSoup和urllib2库扫描mywebsite.com/product=1的URL。但是我想让mywebsite.com增加到最多10。如何提取、读取和替换url的末尾并替换它呢？我注意到其他人实现了urlparse库来替换域main，但是它与我的方法不一样。 > mywebsite.com/product=1 > mywebsit

浏览 2提问于2017-03-03得票数 0

回答已采纳

6回答

重新定位Spyder窗格中的窗格

python、spyder

Python和Spyder新手。如何在Spyder中重新定位窗格。我在左上角设置了编辑器，在右上角设置了对象检查器，在左下角设置了ipython控制台。不知何故，我把它搞乱了，不知道如何重新定位它们。已经爬遍了网络，但没有找到joy。谢谢 jpl

浏览 4提问于2015-03-06得票数 23

1回答

KeyError：‘数据在一个函数中，而在另一个函数中。

python、python-2.7、python-requests

我正试着为我的智能镜造一个刮刀。我已经构建了一个python脚本来获取天气、污染级别和新闻，而我不明白的是为什么我在抓取数据而不是像天气和污染级别这样的其他函数时，在这个函数块中出现了错误。以下是我收到的错误代码： def news(self): reddit1 = "https://www.reddit.com/r/LifeProTips/hot.json" reddit2 = "https://reddit.com/r/technology/hot.json" reddit3 = "https://re

浏览 0提问于2017-02-24得票数 0

回答已采纳

0回答

为什么用xpath提取数据保存到数据库会带有<span class="title">xxxx</span>这样的html标签？

html、数据库、scrapy、python爬虫、title

我的本意是只想爬取xxxxx，为何标签也被爬取了呢 scrapy.py（项目文件）：图片 pipeline.py: 图片

浏览 53提问于2023-08-23

1回答

在AssociationNavigator中具有AttachmentAssociator属性的自定义索引连接器中搜索

sharepoint、sharepoint-2013、bcs、sharepoint-search

嗨, 我有一个自定义的索引连接器，通过AssociationNavigator方法与实体相关联。为了( SharePoint 2013的)搜索爬网关联实体，我们需要在关联实体中设置'DirectoryLink‘属性或'AttachmentAccessor’属性，如下所述：* 当我设置DirectoryLink属性时，搜索将搜索关联的实体(子实体)和父实体。但是，当我将子实体设置为作为附件进行爬网时，如果使用AttachmentAccessor属性，爬网程序只会爬行父实体，而忽略相关实体，因此不会对其进行索引。这是自定义连接器的一些问题吗？就像在帖子里一样。如果更改为.n

浏览 4提问于2013-07-12得票数 1

1回答