scrapy 在爬虫的时候使用xpath提取到的信息全部是 u'u5c97....'这样的字符。所以这样的话在输出的时候不知道自己提取到的信息到底有木有啊=-= 解决方案:
在spider程序中。输出的时候加这两句,当然需要先import codecs json
import codecs json
item = json.dumps(dict(item)) + "\n" ss = item.decode('unicode_escape') print ss
存储的时候遇到编码问题需要这样写:
然后再setting里面将ITEM_PIPELINES的注释取消掉。
ITEM_PIPELINES
Tags: None
Archives QR Code
本文分享自 作者个人站点/博客 前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!