首页
学习
活动
专区
工具
TVP
发布

Python小屋

专栏作者
963
文章
1642055
阅读量
146
订阅数
Python爬取网页中表格数据并导出为Excel文件
本文使用自己创建的网页进行模拟和演示,在爬取真实网页时,分析网页源代码然后修改代码中的正则表达式即可。
Python小屋屋主
2018-09-20
3K0
Python字符串index()方法应用案例一则
问题描述:查找字符串中每个字符第一次出现的位置。 技术要点:字符串的index()方法返回指定子串在当前字符串中首次出现的位置。 参考代码与运行结果: 思考题: 1、如果要查找每个字符最后一次出现的位
Python小屋屋主
2018-07-23
2590
非计算机专业《Python程序设计基础》教学参考大纲
通过本课程的学习,使得学生能够理解Python的编程模式(命令式编程、函数式编程),熟练运用Python运算符、内置函数以及列表、元组、字典、集合等基本数据类型和相关列表推导式、切片等特性来解决实际问题,熟练掌握Python分支结构、循环结构、函数设计以及类的设计与使用,熟练使用字符串方法,适当了解正则表达式,熟练使用Python读写文本文件,适当了解二进制文件操作,了解Python程序的调试方法,了解Python面向对象程序设计模式,掌握使用Python操作SQLite数据库的方法,掌握Python+pandas进行数据处理的基本用法,掌握使用Python+matplotlib进行数据可视化的用法,同时还应培养学生的代码优化与安全编程意识。
Python小屋屋主
2018-07-23
1.4K0
Python使用正则表达式检查书稿中不应该出现的重复字
问题描述:在编写书稿和反复修改书稿时,很容易有多字的情况,例如“用户的的资料”、“需要需要用户输入”,这些不小心的错误用肉眼很难完全发现。但是设定好规则之后,代码是可以非常忠实地完成这个任务的。首先使
Python小屋屋主
2018-04-24
1.4K0
Python正则表达式子模式扩展语法与应用
正则表达式语法实际上是独立于任何语言的,在大多数编程语言都可以使用相同的语法。常见正则表达式语法请参考Python使用正则表达式处理字符串 正则表达式使用圆括号“()”表示一个子模式,圆括号内的内容作
Python小屋屋主
2018-04-17
2.6K0
Python使用正则表达式处理字符串
关于正则表达式基本语法请参考之前发过的文章常用正则表达式锦集与Python中正则表达式的用法,正则表达式扩展语法的高级用法后面会专门整理后再发。 Python标准库re提供了正则表达式操作所需要的功能,既可以直接使用re模块中的方法(见下表)来处理字符串。 方法功能说明compile(pattern[, flags])创建模式对象escape(string)将字符串中所有特殊正则表达式字符转义findall(pattern, string[, flags])列出字符串中模式的所有匹配项finditer(pa
Python小屋屋主
2018-04-16
1.3K0
1900页Python系列PPT分享四:字符串与正则表达式(109页)
总体说明:本套PPT共约1900页,包含董付国老师Python系列图书《Python程序设计基础》(2017年7月第5次印刷)、《Python程序设计(第2版)》(2017年9月第4次印刷)、《Python可以这样学》(2017年11月第4次印刷)、《Python程序设计开发宝典》(2017年10月第2次印刷)中约3/5的内容,前后花费近3年陆续制作和补充完成,其中部分案例也收录在《中学生可以这样学Python》中。本系列PPT所有版权归董付国老师所有,可以免费作为教学或自学参考,一旦发现有人用于商业用途,
Python小屋屋主
2018-04-16
1.3K0
Python正则表达式过滤敏感词
问题描述:很多网站会对用户发帖内容进行一定的检查,并自动把敏感词修改为特定的字符。 技术要点: 1)Python正则表达式模块re的sub()函数; 2)在正则表达式语法中,竖线“|”表示二选一或多选
Python小屋屋主
2018-04-16
1.4K0
Python正则表达式中的贪心模式和非贪心模式
声明:最近发现有人利用我在百度云盘里免费分享的127课Python视频盈利,并声称获得我的授权。在此,我声明,文末百度云盘里的Python视频是免费的,不会授权给任何人或机构进行销售。如果再发现有人卖这些视频,我将诉诸于法律对其进行严厉打击。 分割线======== 正则表达式并不是Python独有的,而是一套独立的语法,很多编程语言都支持。不同语言中使用的正则表达式语法并不完全一样,但大体都是类似的。 之前已经推送过Python中使用正则表达式的一些例子,详见文末的相关阅读。本文重点介绍一下贪心模式和非
Python小屋屋主
2018-04-16
1.5K0
Python裸奔也疯狂:批量爬取中国工程院院士信息
中国工程院院士,是中国设立的工程科学技术方面的最高学术称号,为终身荣誉,由选举产生。在工程科学技术方面作出重大的、创造性的成就和贡献,热爱祖国,学风正派,品行端正,具有中国国籍的高级工程师、研究员、教授或具有同等职称的专家,可被提名并当选为中国工程院院士。 增选院士每两年进行一次,必要时,可提前或延后进行。每次的增选院士名额,由中国工程院主席团讨论决定。 为更好地膜拜众位男神女神,了解其在相关领域做出的杰出贡献,本文代码用于从中国工程院官方网站公开的信息中进行快速提取,主要用来演示Python标准库os、r
Python小屋屋主
2018-04-16
1.4K0
Python正则表达式案例一则:单词非两端字符改为小写
问题描述:给定一段英文,要求把其中所有单词除两端字符之外的其他字母都改为小写。 技术要点: 1)re模块的sub()函数用法; 2)match对象的group()方法。 参考代码: 运行结果: abc
Python小屋屋主
2018-04-16
8350
使用Python检查密码安全程度
本文主要演示几种内置用法的用法和代码优化技巧,所以没有使用正则表达式。 import string def check(pwd): #密码必须至少包含6个字符 if not isinstance(pwd, str) or len(pwd)<6: return 'not suitable for password' #密码强度等级与包含字符种类的对应关系 d = {1:'weak', 2:'below middle', 3:'above middle', 4:'strong'} #分别用来标
Python小屋屋主
2018-04-16
1.6K0
使用Python对图像进行中值滤波
首先解答上一篇文章Python使用标准库subprocess调用外部程序中的问题,该题答案为['1', '2', '3', '4'],在正则表达式中,问号(?)有两种含义,一种是表示前面的字符或模式可
Python小屋屋主
2018-04-16
5.8K0
Python批量检查网页是否被注入其他页面
代码思路:对于给定的文件夹中所有网页文件,读取其内容,然后使用正则表达式检查该文件中是否包含iframe框架,如果有的话就返回文件名和iframe代码,表示是一个怀疑对象,但这并不意味着网页被攻击。使用代码快速挑选出所有的怀疑对象,最后再人工确认一下。 import os import re def detectIframe(fn): #存放网页文件内容的列表 content = [] with open(fn, encoding='utf8') as fp: #读取文件所有行,删除两侧的空白
Python小屋屋主
2018-04-16
1.1K0
Python生成强密码字典文件
本文要点在于演示如何使用正则表达式验证密码强度,以及如何生成大量字符的排列。由于下面代码生成的字典过于庞大,所以并没有很直接的应用场景,可对生成的强密码再次进行过滤,仅保留可能性较大的密码,这样可以减小字典体积,但同时也会降低暴力破解的成功率。 from itertools import permutations import re import string #所有备选字符 allLetters = string.ascii_letters + string.digits + ',.;![]()@#$&*
Python小屋屋主
2018-04-16
1.5K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档