文章/答案/技术大牛

发布

社区首页 >问答首页 >KeyError同时访问存在的标记的属性- BeautifulSoup

问KeyError同时访问存在的标记的属性- BeautifulSoup
EN

Stack Overflow用户

提问于 2017-08-19 03:37:53

回答 1查看 2.1K关注 0票数 1

我的python版本是2.7

# -*- coding : utf - 8 -*-
import urllib
from bs4 import BeautifulSoup

resp = urllib.urlopen('https://movie.douban.com/nowplaying/hangzhou')
html_data = resp.read().decode('utf-8')

soup = BeautifulSoup(html_data,'html.parser')
nowplaying_movie = soup.find_all('div',id = 'nowplaying')
print nowplaying_movie
# notice class_
nowplaying_movie_list = nowplaying_movie[0].find_all('li',class_ = 'list-item')
print nowplaying_movie_list

nowplaying_list = []
for item in nowplaying_movie_list :
    nowplaying_dict = {}
    nowplaying_dict['id'] = item['id']
    nowplaying_dict['name'] = item['data-title']
    nowplaying_movie_list.append(nowplaying_dict)

而nowplaying_movie_list打印出来的内容是

[<li class="list-item" data-actors="\u53e4\u5929\u4e50 / \u5434\u6a3e / \u6258\u5c3c\xb7\u8d3e" data-category="nowplaying" data-director="\u53f6\u4f1f\u4fe1" data-duration="101\u5206\u949f" data-enough="True" data-region="\u9999\u6e2f \u4e2d\u56fd\u5927\u9646" data-release="2017" data-score="7.5" data-showed="True" data-star="40" data-subject="26826398" data-title="\u6740\u7834\u72fc\xb7\u8d2a\u72fc" data-votecount="11357" id="26826398">\n<ul class="">\n<li class="poster">\n<a class="ticket-btn" data-psource="poster" href="https://movie.douban.com/subject/26826398/?from=playing_poster" target="_blank">\n<img alt="\u6740\u7834\u72fc\xb7\u8d2a\u72fc" class="" rel="nofollow" src="https://img3.doubanio

我觉得这很正常。

我想提取网站上电影的id和名称，并将它们保存到一个数据库中，但是错误表明“数据标题”有问题。

错误是

回溯(最近一次调用)：文件“C:/Python27 27/ comments.py"，第19行 “名称”=“数据-标题” KeyError：“数据标题”

我猜这是识别hyphen的问题，因为我很确定在打印的html文件中存在类“数据标题”。

任何想法都会有帮助。

python

beautifulsoup

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-08-19 04:15:36

您刮到的一些列表项似乎不包含data-title属性。其他所有检查结果，那么为什么不只是catch异常呢？

nowplaying_list = []
for item in nowplaying_movie_list:
    try:
        nowplaying_dict = {}
        nowplaying_dict['id'] = item['id']
        nowplaying_dict['name'] = item['data-title']
        nowplaying_list.append(nowplaying_dict)
    except KeyError:
        pass

print(nowplaying_list)

而且，我注意到你在错误的列表中添加。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/45767396

复制

相似问题

问KeyError同时访问存在的标记的属性- BeautifulSoup
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问KeyError同时访问存在的标记的属性- BeautifulSoupEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问KeyError同时访问存在的标记的属性- BeautifulSoup
EN