基本步骤如下:
开发环境Python-v3(3.6)
:
* 文本挖掘(text_mining.py)
* 新闻爬取(crawler_cnstock.py,crawler_jrj.py,crawler_nbd.py,crawler_sina.py,crawler_stcn.py)
* Tushare数据提取(crawler_tushare.py)
* 用法
run_crawler_cnstock.py
,run_crawler_jrj.py
,run_crawler_nbd.py
,run_crawler_sina.py
,run_crawler_stcn.py
这5个py文件,而且可能因为对方服务器没有响应而重复多次运行这几个文件才能抓取大量的历史数据run_crawler_tushare.py
从Tushare获取基本信息和股票价格run_main.py
文件,其中有4个步骤,除了第1步初始化外,其他几步最好单独运行