打开 stackoverflow 主页,在 questions 页面下选择按 vote 排序,爬取前 20000 页,每页将问题数量设置为 50,共 1m 条,(实际上本来是想爬完 13m 条的,但 1m...条后面问题基本上都只有 1 个或 0 个回答,那就选取前 1m 就好吧)
实际上用数据库去重后只有 999654 条问答信息
对爬取数据进行简单分析
votes 分析
降序排列了 votes...answer分析
降序排列了 answers 数,生成折线图
?...views 分析
降序排列了 views 数,生成折线图
?...', 76722),
('android', 69321),
('python', 62502),
('c++', 58173),
('php', 42596),
('ios', 37773),
('jquery