首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python爬虫(urllib2+bs4)数据采集:分析找出百度贴谁是水贴

第二种 : 将所有的id[包括重复]进行排序, 然后最中间的id即为所求 第三种 : 逐渐减小问题的规模的算法, 每一次删除两个不同的id, 那么剩下的id列表中, 水贴王的出现次数必然也满足超过一半...[因为, 如果删除的两个id中没有水贴王id, 水贴王id出现的次数必然超过一半 [x/ sum => x/ sum-2], 如果删除的两个id中有一个为水贴王id, 则水贴王id出现的次数仍然会超过一半...[x/ sum => x - 1/ sum - 2] ] 当然上面的思路还有一个条件就是 : 2 * x > sum [这个这个对于, 删除两个id中水贴王id出现一次可是必杀技, 证明不等式是靠他的。...这里要分析谁是水贴王,首先要收集发帖和发帖者的数据。 这里测试百度贴的李毅的前100页: 大概花费两分钟时间,得到一个5000行的csv文件,可以用excel打开查看。

63150
您找到你想要的搜索结果了吗?
是的
没有找到

开始了解python语言

1.什么是python? Python编程语言是在80年代末构想并在之后被任命为英国广播公司的电视节目Monty Python的飞行马戏团。...Python的独特之处在于它是一种解释性语言。Python IDLE(集成开发环境)一次执行一行指令,这也让我们将它用作计算器。 总结python语言的特点: 1. 解释性 2. 动态特性 3....丰富的社区资源 2.python为什么很强大? 今天很多实现都运行2.x版本,但未来属于Python 3.x。除了Python提供的构造之外,您还可以使用Python包索引。...人工智能应用 Python在神经网络、深度学习方面,主要在于Python都能够找到比较成熟的包来加以调用。...虽然人工智能程序不限于Python,但依旧为Python提供了大量的API,这也正是因为Python当中包含着较多的适用于人工智能的模块,比如sklearn模块等等。

39730

Python-数据挖掘-贴案例-上

Python-数据挖掘-请求与响应 https://tieba.baidu.com/f?kw=爬虫&ie=utf-8&pn=200 https://tieba.baidu.com/f?...参数部分的“爬虫”是搜索的关键字,pn 值与贴的页码有关。如果 n 表示第几页,那么 pn 参数的值是按照 (n-1) * 50 的规律进行赋值。...百度贴中的爬虫,前三页对应的 URL 地址: https://tieba.baidu.com/f?kw=爬虫&ie=utf-8&pn=0 https://tieba.baidu.com/f?...kw=爬虫&ie=utf-8&pn=100 使用 urllib 库来爬取爬虫贴第1~3页的内容,并将爬取到的内容保存到文件中。 ① 提示用户输入要爬取的爬取名,以及要查询的起始页和结束页。...if __name__== "__main__": kw = input("请输入要爬取的贴名:") begin_page = int(input("请输入起始页:")) end_page

92940

Python 动态爱心表白代码,赶紧拿去用

大家好,我是徐公,六年大厂程序员经验,今天为大家带来的是动态心形代码,电视剧 《点燃我温暖你》同款的,大家赶紧看看,拿去向你心仪的对象表白,下面说一下灵感来源。...题外话: 不过剧中似乎是在 Python 里写的 C 语言?编剧们不太严谨且专业,有没有实时追剧的小伙伴,你们发现 Bug 了吗?电视剧爆火,大家都在让自己的程序员男朋友/女朋友写个同款爱心代码。...软件,如 python3步骤二: 安装 PIP 包 tkinter步骤三: 执行 python3 love.py图片 代码效图如下图片 考虑到部分人是编程小白,徐公我也是为大家精心准备了两个更加容易上手的...图片 html 版本的,大家下载之后,打开压缩包,浏览器直接打开 hearts.html 即可查看效果图片 题外话本来是想说一下实现原理的,想想算了,大家可能都不 care,直接拿去用,【电视剧 《点燃我温暖你...》李峋同款 Python爱心表白代码

95200
领券