首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python正则表达式

如果匹配成功,就返回匹配对象;如果失败,就返回None search 使用可标记搜索字符串第一次出现正则表达式。...如果匹配成功,就返回匹配对象;如果失败就返回None findall 查找字符串中所有(非重复)出现正则表达式模式,并返回一个匹配对象 finditer 与findall()函数相同,但返回不是一个列表...对于每一次匹配,迭代都返回一个匹配对象。...num特定子组 groups 返回一个包含所有匹配子组元祖(没有成功,返回空元组) groupdict 返回一个包含所有匹配命名子组字典,所有的子组名称作为字典键 常用模块属性 re.I...>>> m.group() 'the' 使用findall()和finditer()查找每一次出现位置 findall()查询字符串某个正则表达式模式全部非重复出现情况。

1.6K90

正则表达式

“规则字符串” 干什么:爬虫、web开发等等 作用:表达对字符串数据匹配、过滤、提取 逻辑表达式字符串 特点:功能强大,通用性强、适合很多编程语言 1.2简单使用 Regular Expression...,"python\n").group()AttributeError: 'NoneType' object has no attribute 'group' 1.2.2[] [字符]匹配其中任意一个字符...扩展 我们进行分组没有名字,只有下标。...1.8re模块高级用法 findall 查找 sub 替换 split 切割 search 只找一次 search(正则,数据) → 匹配结果对象,如果成功返回对象,失败返回None 1)从头开始往后搜索...:jpg|png)",url) \a和\b在系统已经有了,算一个字符 1.10r作用 如果字符串数据中有双斜杠 正则需要四反斜杠来进行匹配 为了解决反斜杠困扰问题,使用r标识数据 自动对字符串

2.5K40
您找到你想要的搜索结果了吗?
是的
没有找到

【已解决】Python AttributeError: ‘NoneType‘ object has no attribute ‘X‘ 报错

同时欢迎大家关注其他专栏,我将分享Web前后端开发、人工智能、机器学习、深度学习从0到1系列文章 一、Bug描述 在Python编程AttributeError是一个常见错误,它通常发生在尝试访问一个对象属性或方法时...,但该对象没有这个属性或方法。...特别地,AttributeError: ‘NoneType’ object has no attribute 'X’这个错误表明我们尝试访问属性X属于一个None类型对象。...None,没有属性x 原因二:错误变量初始化 在某些情况下,变量可能没有被正确初始化,或者被错误地设置为None。...错误示例: obj = None print(obj.x) # 引发AttributeError 原因三:异常处理不当 在处理可能抛出异常代码时,如果没有正确捕获异常,并且在异常发生后尝试访问对象属性

77320

解决AttributeError: ‘NoneType‘ object has no attribute ‘array_interface‘

如果我们传递给这些函数或方法数组对象为None,就会出现"AttributeError: 'NoneType' object has no attribute 'array_interface'"错误...这是因为None是Python中表示空对象特殊值,它没有__array_interface__属性,而NumPy函数和方法需要使用这个属性来进行数组操作。...示例代码:解决AttributeError: 'NoneType' object has no attribute 'array_interface'在实际应用场景,我们可以通过以下示例代码来演示如何解决...它被视为一个NoneType实例,表示"没有"或"无"。 下面是关于​​​None​​一些重要特点和使用情况:表示空对象:​​None​​在Python中用于表示没有指向任何对象情况。...但需要注意是,​​None​​是一个对象,它与其他对象不同,因此在比较和操作需要谨慎使用。

61600

四.网络爬虫之入门基础及正则表达式抓取博客案例

目录: 一.什么是网络爬虫 二.正则表达式 三.Python网络数据常用模块 1.urllib模块 2.urlparse模块 四.正则表达式抓取网络数据常见方法 1.抓取标签间内容 2.标签参数...为了解决上述问题,定向抓取相关网页资源网络爬虫应运而生,下图是Google搜索引擎架构图,它从万维网相关数据,通过文本和连接分析,再进行打分排序,最后返回相关搜索结果至浏览。...---- 3.字符串处理及替换 在使用正则表达式网页文本时,通常需要调用find()函数找到指定位置,再进行进一步,比如获取class属性为“infobox”表格table,再进行定位。...假设现在需要内容如下: 博客网址标题(title)内容 所有图片超链接,比如“xxx.jpg” 分别博客首页四篇文章标题、超链接及摘要内容...通过浏览打开网页,选中需要内容,右键鼠标并点击“审查元素”或“检查”,即可找到所需节点对应HTML源代码,如图所示。

79110

四.网络爬虫之入门基础及正则表达式抓取博客案例

为了解决上述问题,定向抓取相关网页资源网络爬虫应运而生,下图是Google搜索引擎架构图,它从万维网相关数据,通过文本和连接分析,再进行打分排序,最后返回相关搜索结果至浏览。...---- 3.字符串处理及替换 在使用正则表达式网页文本时,通常需要调用find()函数找到指定位置,再进行进一步,比如获取class属性为“infobox”表格table,再进行定位。...假设现在需要内容如下: 博客网址标题(title)内容 所有图片超链接,比如“xxx.jpg” 分别博客首页四篇文章标题、超链接及摘要内容...第一步 浏览源码定位 首先通过浏览定位需要元素源代码,比如文章标题、超链接、图片等,发现这些元素对应HTML源代码存在规律,这称为DOM树文档节点分析。...通过浏览打开网页,选中需要内容,右键鼠标并点击“审查元素”或“检查”,即可找到所需节点对应HTML源代码,如图所示。

1.4K10

python 内置模块

方法 4、split()方法 5、sub()方法 6、sunb()方法 7、compile()方法 8、finditer()方法 3、无名分组、有名分组 无名分组: 有名分组: re 模块实战(爬虫) 红牛分公司信息案例...、re 模块方法示例: 1.findall()方法 定义:findall根据正则匹配所有符合条件数据,匹配成功返回list,如果没有匹配到返回空列表。...: 'NoneType' object has no attribute 'group' 3、match()方法 定义:match根据正则从头开始匹配,相当于正则表达式^,文本内容必须在开头匹配上..., 18), match='110105199812067023'> 110105199812067023 10105199812067 10105199812067 023 re 模块实战(爬虫) 红牛分公司信息案例...", response.text) # 调整信息结构 company_info = pd.DataFrame({'公司名': get_company_name, '地址': get_company_addre

93620

《手把手带你学爬虫──初级篇》第4课 正则表达式以及re库用法

上面的讲解,类似re.findall()用法,叫做函数式用法;我们也可以使用面向对象思想,来调用这些方法: In [31]: regex = re.compile(r'[1-9]\d{5}')...注意1:没有经过编译正则表达式字符串仅仅是一种表达形式,只有经过编译正则表达式字符串才能形成一个正则表达式对象,它表示了一组符合规则字符串。...In [33]: type(match) Out[33]: _sre.SRE_Match Match对象常用属性有4个: 属性 含义 .re 匹配时使用pattern对象(正则表达式) .string...实战——定向京东100页商品信息 问题0:按照销量进行,这样可以排除页面中广告 得到连接如下: https://search.jd.com/Search?...打开浏览开发者工具栏,将页面从上往下慢慢拖动,并且观察Network网络请求,突然,有一个神秘请求出现了,它连接为https://search.jd.com/s_new.php?

1K52

「Python爬虫系列讲解」三、正则表达式爬虫之牛刀小试

3.1 标签间内容 3.1.1 title标签间内容 3.1.2 超链接标签间内容 3.1.3 re标签和td标签间内容 3.2 标签参数 3.2.1 超链接标签...2 Python网络数据常用模块 2.1 urllib模块 urllib 是 Python 用于获取 URL(Uniform Resource Locators,同意资源定位库函数,可以用于远程数据并保存...3.2 标签参数 3.2.1 超链接标签URL HTML超链接基本格式为 “ 链接内容 ” import re content = ''' <a href...3.2.2 图片超链接标签URL 在HTML,我们可以看到各式各样图片,其中图片标签基本格式为“ ”,只有通过这些图片原地址,才能下载对应图片至本地...# 比如先获取class属性为“infobox”表格table,然后再进行定位 start = content.find(r'') # 起点位置 end

1.3K10

Python编程常见出错信息及原因分析(2)

: 'set' object has no attribute 'count' 错误原因分析与解决方案: 错误信息显示当前对象并不具有一个叫做'***'属性或方法,所以调用失败。...这种错误一般是因为记错了对象属性或方法,也可能是前面某段代码代码修改了变量x类型,自己却忘记了。...遇到这种错误时,首先应使用type()函数确定当前位置x是什么类型,然后可以在使用dir()确定该类型对象是否具有'***'属性或方法。...: 'NoneType' object has no attribute 'remove' 错误原因分析与解决方案: 这种错误比较隐蔽一些,表面看上去好像是某个类型对象不具有某某某属性,而实际上是函数或方法误用...在Python,如果函数或方法没有返回值,则认为其返回控制None。不过,这种错误又比较明显,因为一般是'NoneType' object has no attribute......

3.3K70

Python对象相关内置函数

针对一个对象,通过以下几个函数,可以获取到该对象一些信息。...) 'NoneType'> 使用就是括号里加参数,返回这个参数属于类 123 是int类  'str'是 str类,None是NoneType类 >>> type(123)==type(456) True...,返回一个包含字符串list ,一个str对象所有属性和方法 >>> dir('ABC') ['__add__', '__class__',..., '__subclasshook__', 'capitalize...--------------- 如果试图获取不存在属性,会抛出AttributeError错误: >>> getattr(obj, 'z') # 获取属性'z' Traceback (most...'z' 可以传入一个default参数,如果属性不存在,就返回默认值: >>> getattr(obj, 'z', 404) # 获取属性'z',如果不存在,返回默认值404 404 也可以获得对象方法

84730

爬虫系列:连接网站与解析 HTML

在 Python 我们使用 requests 库来访问目标网站,使用 BeautifulSoup 对获取内容进行解析。...: except AttributeError as e: 以上就完成了一个使用 Python 连接网站过程。...这个时候如果没有异常我们就会拿到网站 HTML 代码,之后根据需要进一步对 HTML 进行内容解析,获取自己需要内容。...你目标内容可能隐藏在一个 HTML “烂泥堆”第20层标签里,带有许多没用标签或 HTML 属性,你按照目标网站代码层级你有可能写出如下一行代码抽取内容: bsObj.findAll("table...")[4].findAll("tr")[2].find("td").findAll("section")[1].find("a") 虽然以上写法可以达到目标,但是这样写法看起来并不是很好。

2.3K20
领券