首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python采集微博热评进行情感分析祝你狗年脱单

如果自己需要爬(cai)虫(ji)的数据量比较大,为了防止被网站封Ip,可以分时段爬取,另外对于爬到的数据一般是用来存储数据库,这就需要对数据进行去重处理,记录上次爬取的状态,就可以实现在爬虫中断后,可以快速继续上次的状态,实现增量爬取,这里可以参考我之前写过的一个新闻采集,增量采集新闻数据,本文写的对新浪微博的数据采集和处理完整代码在我的Github。 玩微博的人大多数应该知道微博搞笑排行榜的,刚好写这篇文之前看到榜姐1月8号0点话题是一人说一个,追女孩的小道理,感觉这个话题简直是对广大单身男性的福利啊,ヾ(✿゚゚)ノ,故有了何不就采集一下评论来分析一波的想法。

02

淘宝流量三段论之三:无法成为美丽说的微博

阿里投资微博后,有声音说微博会成为一个大号美丽说。甚至有人说这是阿里对社会化电商的狙击。事实上,淘宝并不会狙击社会化电商,相反它们会拥抱社会化电商。三段论之一分析了淘宝需要更多流量,进而需要更多外部流量生产机器。如果说微淘有点社会化电商的味道,我信。但将新浪微博和社会化电商甚至大号美丽说拽到一起,我认为挺难的。 首先微博仍然是一个信息媒体,再加上些许社交功能。它不应该成为美丽说。 人 们上去不只是没到思考“买啥”的阶段,连“想买”都没到。这时候电商广告的出现就跟有人街边抓住我促销的感觉一样。不仅烦,命中

05
领券