我正在使用PythonBeautifulsoup从以下网址'https://www.pro-football-reference.com/teams/nwe/2013_injuries.htm‘中抓取网页我想从URL中抓取球员的名字,他们的受伤情况和受伤的那一周。from urllib.request import urlopen as uReq
from bs4 import Be
您知道为什么BeautifulSoup教程中的第一个示例提供了AttributeError: 'NavigableString' object has no attribute 'name'吗?根据的说法,超文本标记语言中的空格字符导致了这个问题。我尝试了几页的源代码,其中一页起作用了,其他的给出了相同的错误(我删除了空格)。你能解释一下"name“指的是什么吗?为什么会发生这个错误?
Google的金融API是不完整的--页面上的许多数字,例如:
不能通过API使用。我需要这些数据来根据Greenblatt的公式对加拿大证券交易所的公司进行排名,该公式可以通过谷歌搜索"greenblatt index scans“获得。我的问题是:访问和处理这些网页上的数据的最智能/最干净/最有效的方式是什么?在这种情况下,单调乏味的方法真的有必要吗?如果是,那么