我在使用https://codingandfun.com/scraping-sec-edgar-python/的代码时遇到了一个问题
我试着联系网站的作者,但没有成功。我希望能在这里得到一些帮助,并提前感谢你。
当我进入打印(下载)步骤时,输出似乎是一些奇怪的特殊字符,而不是有组织的、牢固的urls。证券交易委员会的master.idx有什么问题吗?有人能帮我找出这个问题吗?
以下是代码:
import bs4 as bs
import requests
import pandas as pd
import re
company = 'Facebook Inc'
filing = '10-Q'
year = 2020
quarter = 'QTR3'
#get name of all filings
download = requests.get(f'https://www.sec.gov/Archives/edgar/full-index/{year}/{quarter}/master.idx').content
download = download.decode("utf-8").split('\n')
print (download) 发布于 2021-12-21 20:37:02
您需要按照描述的这里声明您的用户代理,否则您将下载一个html页面,提示您这样做。
https://stackoverflow.com/questions/70321435
复制相似问题