我需要从xbrl网站获取所有的Edgar搜索数据,无论是在XML格式或RSS Feed形式。这是在这个链接http://www.sec.gov/edgar/searchedgar/cik.htm相同的搜索,我想在我的网站上创建,但不想使用所有的数据,只想使用我的网站中的一点信息。这是所有的项目列表http://www.sec.gov/divisions/corpfin/organization/cfia.shtml,但不知道如何到达一个单一的点。
发布于 2013-10-31 02:09:41
sec网站有很多数据,所以必须首先决定你想要获得什么信息,大多数情况下你会对包含财务报表的10-Q和10-K表格感兴趣。
在2010年前,信息是以html格式提交的,在html和XML (XBRL)文件中的单词之后。此链接http://www.sec.gov/divisions/corpfin/organization/cfia-c.htm提供了在sec注册的所有公司的CIK,如果您想了解某个公司的信息,可以使用以下网址:
http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=GOOG&type=&dateb=&owner=include&count=40
这将显示该公司的所有文件,您可以从以下URL更改几个参数:
count :将返回请求中的文件数
CIK :可以是公司的CIK编号或符号
类型:这允许您限制您想要的文件类型,例如,type=10-Q将只返回该公司的10-Q文档。
您可以使用任何爬虫来获取html和xml文件。
此外,您还可以在此处找到公司的所有文件:
http://www.sec.gov/Archives/edgar/data/companyCIK
https://stackoverflow.com/questions/16635860
复制相似问题