首页
学习
活动
专区
工具
TVP
发布

程序员的知识天地

那些关于程序员的趣事分享,以及经验,学习心得。前端学习知识库。
专栏作者
633
文章
849282
阅读量
52
订阅数
Python爬虫小偏方:修改referer绕开登录和访问频率限制
遇到问题1,我们的第一反应是达到对方访问频率限制,IP被对方屏蔽了,然后就找更多IP和降低访问频率。 遇到问题2,就硬着头皮研究对方加密方法,或人肉登录后用机器把cookie保存下来,耗去好几天时间。
一墨编程学习
2019-05-15
1.7K0
CSS基础知识(一)
在HTML中通过使用 <style> 标签引入CSS样式, <style> 标签用于为HTML文档定义样式信息; <style> 标签位于 <head> 标签中,它规定浏览器中如何呈现HTML文档; 在 <style> 标签中,type是必须属性,用于定义style元素的内容,值为“text/css”;
一墨编程学习
2019-05-15
6440
大规模异步新闻爬虫【5】:网页正文的提取
前面我们实现的新闻爬虫,运行起来后很快就可以抓取大量新闻网页,存到数据库里面的都是网页的html代码,并不是我们想要的最终结果。最终结果应该是结构化的数据,包含的信息至少有url,标题、发布时间、正文内容、来源网站等。
一墨编程学习
2019-05-14
1.5K0
大规模异步新闻爬虫【4】:实现一个同步定向新闻爬虫
前面,我们先写了一个简单的百度新闻爬虫,可是它槽点满满。接着,我们实现了一些模块,来为我们的爬虫提供基础功能,包括:网络请求、网址池、MySQL封装。
一墨编程学习
2019-05-14
8050
完善我们的新闻爬虫【1】:实现一个更好的网络请求函数,
实现了一个简单的再也不能简单的新闻爬虫后,这个项目有很多漏洞,以及需要解决的问题。现在我们就来去除这些槽点来完善我们的新闻爬虫。这是第一章,之后会持续来完善好我们的新闻爬虫。
一墨编程学习
2019-05-14
6680
Python爬虫开发的3大难题,别上了贼船才发现,水有多深
写爬虫,是一个非常考验综合实力的活儿。有时候,你轻而易举地就抓取到了想要的数据;有时候,你费尽心思却毫无所获。
一墨编程学习
2019-05-14
1.4K0
Python 爬虫网页,解析工具lxml.html(一)
狭义上讲,爬虫只负责抓取,也就是下载网页。而实际上,爬虫还要负责从下载的网页中提取我们想要的数据,即对非结构化的数据(网页)进行解析提取出结构化的数据(有用数据)。比如,我们要抓取了一个新闻页面的网页(html)下来,但我们想要的是这个网页中关于新闻的结构化数据:新闻的标题、新闻的发布时间、新闻的正文等。
一墨编程学习
2019-05-13
2.9K0
Python爬虫网页,解析工具lxml.html(二)
【前情回顾】如何灵活的解析网页,提取我们想要的数据,是我们写爬虫时非常关心和需要解决的问题。
一墨编程学习
2019-05-13
1.4K0
Python 爬虫网页内容提取工具xpath
上一节,我们详述了lxml.html的各种操作,接下来我们熟练掌握一下XPath,就可以熟练的提取网页内容了。
一墨编程学习
2019-05-13
3.1K0
python项目实战:切换iframe模拟登陆126网易邮箱
今天为大家介绍一个模拟登陆126网易邮箱的案例,大多数登陆都是用input,今天这个案例特殊一点,126登陆框是使用iframe进行嵌套的,所以需要先切换到该iframe,但是还有要用到selenium来控制浏览器
一墨编程学习
2019-05-08
8960
用python抓取某腾视频所有电影的爬虫,不用钱就可以看会员电影!
用python实现的抓取腾讯视频所有电影的爬虫 # -*- coding: utf-8 -*- import re import urllib2 from bs4 import BeautifulSoup import string, time import pymongo NUM = 0 #全局变量,电影数量 m_type = u'' #全局变量,电影类型 m_site = u'qq' #全局变量,电影网站 #根据指定的URL获取网页内容 def get
一墨编程学习
2018-12-19
1.6K0
还在付费爱奇艺VIP?神级程序员教你用Python任意下!
我相信如果看电影的都知道,不管是爱奇艺还是腾讯视频还是优酷很多的电影电视都是需要VIP的,但是为了看这么一个电视或者电影开个vip又不是很划算。
一墨编程学习
2018-12-06
3.7K0
众多Python Web框架比较,哪个适合你,你就用哪个!
Python程序员有很多很好的选择来创建Web应用程序和API;Django,Weppy,Bottle和Flask引领潮流。
一墨编程学习
2018-12-06
4.5K0
Python两步实现网页天气爬虫程序
说道爬虫大家或许感觉非常神秘,其实它没有我们想象的那么神奇,今天我们就来揭开它神秘的面纱。呵呵,简单两步就可以实现一个网页天气爬虫程序。。。
一墨编程学习
2018-11-21
5610
三年经验程序员面试意向薪资24K, 却因没大厂背景被压榨。 网友:继续面试!
在求职的过程中,面试是一道非常重要的“防线”,只有通过了面试才能够正常入职公司!但是很多互联网公司在面试技术岗位的时候,不仅要求面试者具备相应的技术,甚至学历、背景等等都要一定的标准才能入职,这可苦了那些有技术却没有经历的程序员!
一墨编程学习
2018-10-27
8010
一个外包小公司干掉了一个国企的故事,发人深省!
随着互联网+口号和政策的推动,很多企业,尤其是传统企业都在转型,也越来越认识到互联网的重要性,都在想办法如何切入互联网领域,无论是切入互联网是为了分一杯羹,还是利用互联网提高公司的管理和效率,都是为了走进政府提倡的互联网+之中。
一墨编程学习
2018-10-27
2.1K0
前后端分离后的前端时代,使用前端技术能做哪些事?
什么是前后端分离,要区分前端和后端,需要有个明确的界限。一般,用户可以直接看到的东西,都是属于前端的范畴,除了前端之外都属于后端了。
一墨编程学习
2018-10-27
2.1K0
5个方法对于重量级网站的图片优化
图像是每个网站的关键组成部分。 根据 HTTP Archive ,图像占网页上需要加载总数据的比例达60%以上。 几乎成为所有网站上重要的组成部分,无论是电子商务,新闻,时尚网站,博客还是旅游门户网站,图像优化都很重要,如果你想加快你的 图像重量级网站 访问速度 , 这 也许是很容易做到的事情 。
一墨编程学习
2018-10-22
1.5K0
Web 前端模板引擎的选择
模板引擎负责组装数据,以另外一种形式或外观展现数据。 浏览器中的页面是 Web 模板引擎最终的展现。
一墨编程学习
2018-10-22
2.9K0
程序员吐槽:好多在阿里混不下去的去小公司当领导,只BB不干活!
公司其实就像一个江湖,能力有高有低,因此很容易造成彼此看不起的现象。有小公司的程序员就在网络上吐槽,称其公司来了阿里前员工,感觉就是个渣渣,天天只动嘴不干活,能力也不见得高到哪里去。
一墨编程学习
2018-10-18
7740
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档