文章/答案/技术大牛

发布

社区首页 >问答首页 >在scrapy中将逗号分隔的项拆分为列表

问在scrapy中将逗号分隔的项拆分为列表
EN

Stack Overflow用户

提问于 2019-05-06 11:52:35

回答 2查看 444关注 0票数 1

问题

我希望从下面的代码中提取关键字，并将它们作为分隔的列表项存储在json中。

<meta name="keywords" content="keyword1, keyword2, keyword3">

到目前为止，我使用了以下代码：

'keywords': [i.split(', ') for i in response.xpath('//meta[@name="keywords"]/@content').extract()]

现在的结果

这将导致json文件如下所示：

keywords:
     0:
        0: keyword1
        1: keyword2
        2: keyword3

或者在这样的原始数据中：

{"keywords": [["keyword1", "keyword2", "keyword3"]]}

预期结果

但我需要他们分开如下：

keywords:
     0:
        0: keyword1
     1:
        0: keyword2
     2:
        0: keyword3

或者输入原始数据：

{"keywords": [["keyword1"], ["keyword2"], ["keyword3"]]}

有什么办法解决这个问题吗？*

scrapy

python

json

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-05-06 12:01:05

尝试：

>>> from scrapy import Selector
>>> sel = Selector(text="""<meta name="keywords" content="keyword1, keyword2, keyword3">""")
>>> keywords = sel.xpath('//meta[@name="keywords"]/@content').get()
>>> [[i] for i in keywords.split(', ')]
[[u'keyword1'], [u'keyword2'], [u'keyword3']]

或者：

>>> [[[k] for k in i.split(', ')] for i in sel.xpath('//meta[@name="keywords"]/@content').extract()]
[[[u'keyword1'], [u'keyword2'], [u'keyword3']]]

UPD：

也许在两种情况下更好地分割逻辑，比如：

>>> keywords = []
>>> for i in sel.xpath('//meta[@name="keywords"]/@content').extract():
...     if ',' in i:
...         for k in i.split(','):
...             keywords.append([k.strip()])
...     else:
...         keywords.append([i.strip()])
... 
>>> keywords
[[u'keyword1'], [u'keyword2'], [u'keyword3']]

票数 3

Stack Overflow用户

发布于 2019-05-06 12:03:57

尝试将代码更改为，

'keywords': [[x] for x in [i.split(', ') for i in response.xpath('//meta[@name="keywords"]/@content').extract()]]

在i.split(', ')中添加[]将生成单独的数组。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56004678

复制

相似问题

问在scrapy中将逗号分隔的项拆分为列表
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在scrapy中将逗号分隔的项拆分为列表EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在scrapy中将逗号分隔的项拆分为列表
EN