首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

利用python读取excel公司名称获取公司经营范围并回填进excel

前几天朋友托帮完成一份地区教育类型公司经营范围,表已经有了公司名称及地点等信息,但是还缺少经营范围,由于数据量比较大,一个一个去百度搜再复制到表里,工作量有点大,可能需要好几天不吃不喝Ctrl...我们可以excel把公司名称都读出来,然后让它自动去搜索获取公司经营范围,并批量回填到excel 首先想到是利用selenium来模拟浏览器来进行查询,我们先pip install selenium...id,我们可以通过F12查看页面元素来获取 也可以通过name属性获取,还可以通过xpath、class等等去获取,这里就不一一讲述了,列在下面有兴趣可以去试试,一般常用id和name去获取...既然直接请求地址获取数据,那我们就解析获取数据拿到我们想要东西就好了,这里习惯用xpath来解析,感兴趣也可以用正则等其他方法解析。...,接下来我们就可以进行批量操作了,把查询到参数换成可变excel读取,我们先来实现从excel读取到数据吧,开干。

1.4K40
您找到你想要的搜索结果了吗?
是的
没有找到

Python 基础语法(一)「建议收藏」

大家好,又见面了,是你们朋友全栈君。 Python特点   1. 简单     Python是一种代表简单思想语言。   2. 易学     Python有极其简单语法。   3....模块可以其他程序‘输入’(import)以便利用它功能。   ...在python程序中导入其他模块使用’import’, 所导入模块必须在sys.path所列目录,因为sys.path第一个字符串是空串”即当前目录,所以程序可导入当前目录模块。 1....4. dir()函数     dir(sys)返回sys模块名称列表;如果不提供参数,即dir(),则返回当前模块定义名称列表。     ...;使用del可以删除列表项,eg: del l[0] # 如果超出范围,则IndexError     list函数如下: append(value)  —向列表尾添加项value l = [1,

57940

Python基础(一)

为了照顾小白,把之前博客上Python基础分享过来。好像是18年时候,大一东西。 一共四篇,声明下:Python入门难度为0,比Java,C++根本不能比,你会英语基本没问题。...模块可以其他程序‘输入’(import)以便利用它功能。...在python程序中导入其他模块使用'import', 所导入模块必须在sys.path所列目录,因为sys.path第一个字符串是空串''即当前目录,所以程序可导入当前目录模块。...,也可在py文件为__name__赋值;如果是__name__,说明这个模块被用户 (4) dir()函数 dir(sys)返回sys模块名称列表;如果不提供参数,即dir(),则返回当前模块定义名称列表...;使用del可以删除列表项,eg: del l[0] # 如果超出范围,则IndexError list函数如下: append(value)  ---向列表尾添加项value l = [1, 2,

89110

Python基础语法(2)

模块可以其他程序‘输入’(import)以便利用它功能。   ...在python程序中导入其他模块使用'import', 所导入模块必须在sys.path所列目录,因为sys.path第一个字符串是空串''即当前目录,所以程序可导入当前目录模块。 1....4. dir()函数     dir(sys)返回sys模块名称列表;如果不提供参数,即dir(),则返回当前模块定义名称列表。     ...del -> 删除一个变量/名称,del之后,该变量就不能再使用。 四、数据结构   python有三种内建数据结构:列表、元组和字典。 1...., 20] index(value, [start, [stop]])  ---返回列表第一个出现值为value索引,如果没有,则异常 ValueError l = [1, 2, 2] a =

1.3K130

独家 | 教你用Scrapy建立你自己数据集(附视频)

Python进行网页爬取 当我开始工作时,很快意识到有时你必须收集、组织和清理数据。 本教程,我们将收集一个名为FundRazr(https://fundrazr.com/)众筹网站数据。...我们将使用start_urls列表元素来获取单个筹款活动链接。 1.下面的图片显示,根据您选择类别,您将获得不同起始网址。 黑色突出显示部分是我们此次爬取分类。...找到一个很好第一个start_url 对于本教程,列表start_urls第一个是:https://fundrazr.com/find?...它作用是创建一个start_urls列表。变量npages代表是我们想从多少个额外页面(在第一页之后)获取筹款活动链接。...虽然非常方便,操作也很熟悉,但是Python dicts本身缺少结构化:容易造成字段名称输入错误或返回不一致数据,特别是在具有许多爬虫较大项目中(这一段几乎是直接scrapy官方文档复制过来

1.8K80

Python 容器 collections

本文字数:3365 字 阅读本文大概需要:9 分钟 写在之前 我们都知道 Python 内置了许多标准数据结构,比如列表,元组,字典等。...namedtuple 相信你已经熟悉了元组,如果不熟悉请看这篇(零基础学习 Python 之元组)。一个元组相当于一个不可变列表,你可以存储一个数据序列。...在上面的代码,我们元组名称是 people,字段名称是 name,age,like。...: len(deq) == 5 deq == deque([1, 2, 3]) 我们也可以对这个列表大小进行限制,当超出我们限制时候,数据会另一端被 pop 出去,具体我们来看下面的操作:...: deque([1, 2, 3], maxlen=3) deque([2, 3, 4], maxlen=3) 当超出 maxlen 值时,最左边数据将从队列删除。

77230

Python基础 | 新手学Python时常见语法错误和异常

解析器会输出出现语法错误那一行,并显示一个“箭头”,指向这行里面检测到第一个错误。...异常有不同类型,而其类型名称将会作为错误信息一部分打印出来:上述示例异常类型依次是:ZeroDivisionError, NameError 和 TypeError。...lis一共5个元素,若我们试图访问第7个元素也就是lis[6]时会出现 列表超出了范围提示。...ImportError:当我们试图引入不存在库时,并且当 from ... import "from list" 存在无法找到名称时 In [16]: from os import x Traceback...我们使用 Control+C 或 Delete时,就会出现中断程序提示,常常在程序执行过程想复制部分打印信息时候错使用 Control+C想着复制却使得程序中断情况。

7K41

Python属性

通过名称修饰,私有属性或方法以特定方式修改,以便更难类外部访问它们。 让我们看看它是如何工作。...然而...看起来方法是完全受保护,尽管不久前声称在Python,私有属性并不是完全受保护。那么,到底发生了什么呢? 我们刚刚经历了名称修饰工作原理。...迟早,它们会帮助你适应Python不同世界,其中隐私概念运作方式如此不同。 总结一下,Python无法完全保护类属性。然而,它提供了两个级别的保护,称之为指示和捉迷藏隐私。 指示隐私。...脚注 ¹ 请记住,在Python,方法是类属性。因此,每当我提到属性隐私性时,指的是包括方法在内属性隐私性。 ² 名称改编有两个目的: 它提高了类私有属性和方法保护级别。...>>> x [1, 2, 3, 4, 5, 6] 正如你所见,这个操作将两个列表相加;作为就地操作,它会影响第一个列表,并使第二个列表保持不变。

16630

Python标准数据类型-List(列表)

这一马平川,一眼见底活,不想要,的人生,自己书写,余生很长,请多关照,的人生,敬请期待 ✨序列概述 在Python序列是最基本数据结构 序列是一块用于存放多个元素内存空间 Python...内置了5个常用序列结构,分别是列表、字符串、元组、字典、集合 序列基本操作 索引 序列每一个元素都有一个编号称为索引(indexing) 索引0开始递增(下标为0表示第一个元素、下标为...# 索引0开始以此类推 修改列表元素 修改列表元素只需要通过索引获取该元素,然后再重新赋值即可 实例:定义一个名为demo列表修改索引值为1元素 demo = ["hello", "python...:列表名称 obj:要指定获取次数元素 返回值:元素在列表中出现次数 实例:创建一个数字列表获取7出现次数 demo = [1, 2, 4, 2, 7, 6, 3, 7, 7, 5, 9] print...("移除后列表", demo) 删除列表某个值第一个匹配项remove() remove()方法语法格式:list.remove(element) 参数说明如下: element:要移除元素

20720

Python环境】12道 Python面试题总结

当使用del对对象显示销毁或者引用超出作用于或者被重新赋值时,该对象引用计数就会减少。 可以使用sys.getrefcount()函数来获取对象的当前引用计数。...re模块research(pattern,string [,flags]),在string搜索pattern第一个匹配值。...因此,在父类设置 x = 1 会使得类变量 X 在引用该类和其任何子类值为 1。这就是因为第一个 print 语句输出是 1 1 1。...尽管如此,试图访问一个列表超出列表成员数作为开始索引切片将不会导致 IndexError,并且将仅仅返回一个空列表。...好吧,第一行代码觉对是第一次见,第一行输出是[[], [], [], [], []],一个含有5个空列表列表,而第二行输出是[[10], [10], [10], [10], [10]],只能解释为这

1K50

12道 Python面试题总结

当使用del对对象显示销毁或者引用超出作用于或者被重新赋值时,该对象引用计数就会减少。 可以使用sys.getrefcount()函数来获取对象的当前引用计数。...re模块research(pattern,string [,flags]),在string搜索pattern第一个匹配值。...因此,在父类设置 x = 1 会使得类变量 X 在引用该类和其任何子类值为 1。这就是因为第一个 print 语句输出是 1 1 1。...尽管如此,试图访问一个列表超出列表成员数作为开始索引切片将不会导致 IndexError,并且将仅仅返回一个空列表。...好吧,第一行代码觉对是第一次见,第一行输出是[[], [], [], [], []],一个含有5个空列表列表,而第二行输出是[[10], [10], [10], [10], [10]],只能解释为这

1.5K90

利用 PHP 特性绕 WAF 测试

利用包装函数将这些构造任何一个用作变量函数。 改进用户输入检测 如果易受攻击脚本用户输入中排除双引号和单引号等字符,会发生什么情况?即使不使用双引号也可以绕过它吗?...以前有效负载现在应该被阻止: 幸运是,在 PHP ,我们并不总是需要引号来表示字符串。...如果对“系统”进行 grep,可以发现它索引号并将其用作代码执行字符串: 显然,这应该对我们 Cloudflare WAF 和脚本过滤器有效: 字符数组 PHP 每个字符串都可以用作字符数组...使用相同技术,您可以使用类似的方法选择所需所有字符 OWASP CRS3 有了 OWASP CRS3,一切都变得更难了。首先,使用之前看到技术,只能绕过第一个偏执级别,这太神奇了!...对于 2 级偏执狂,由于规则 942430“受限 SQL 字符异常检测(args):超出特殊字符数”,所有事情都变得困难。能做只是执行一个不带参数命令,如“ls”、“whoami”等。

38520

Python sys os getpass 包导入

xx 某个模块包导入某个模块 from module.xx.xx import xx as rename 某个包导入模块并给起个别名 from module.xx.xx import * 某个包导入该包下所有模块...0 sys.version 获取Python解释程序版本信息 sys.maxint 最大Int值 sys.path 返回模块搜索路径,初始化时使用PYTHONPATH环境变量值 sys.platform...dirname os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shellrmdir dirname os.listdir('dirname') 列出指定目录下所有文件和子目录...其实就是os.path.split(path)第一个元素 os.path.basename(path) 返回path最后文件名。如何path以/或\结尾,那么就会返回空值。...path所指向文件或者目录最后修改时间 os.getpid() 获取进程pid os.getppid() 获取父进程pid subprocess 导入方式:import subproess

1.3K10

流畅 Python 第二版(GPT 重译)(十二)

每条记录都有一个"serial"字段,这是记录在列表唯一标识符。 使用 Python 控制台来探索数据集,如示例 22-2 所示。 示例 22-2....Python 获取__new__返回实例,然后将其作为__init__第一个参数self传递。我们很少需要编写__new__,因为object继承实现对绝大多数用例都足够了。...③ 现在很容易获取venue名称。 ④ event.speakers属性返回一个Record实例列表。...② 将record_type大写以获得可能类名;例如,'event'变为'Event'。 ③ 模块全局范围获取名称对象;如果没有这样对象,则获取Record类。...如果未提供可选object参数,则dir列出当前范围名称。 getattr(object, name[, default]) object获取由name字符串标识属性。

11610

一篇文章带你解锁Python操作系统级别模块psutil

可以看出第一个命令打印出来当前用户名信息,第二个则是打印出了系统中所有的pid,也就是如下所示: ? 可以看到所有的进程号,那么获取这些进程号有什么用呢?答案是肯定。...是不是简单到超出想象?反之,我们也可以通过进程名来推敲出进程所在所有pid号噢,请看下图: ? 7、通过对process方法进一步延伸,发现它还有好多有趣方法: ?...='inet') 返回套接字连接打开过程作为一个列表 pp.cpu_affinity(cpus=None) 获取或设置CPU关联过程 pp.cpu_percent(interval=None) 返回一个浮点数表示当前进程...10、通过平时对英语积累,相信大家应该能猜到这些方法用处了,下面我们来看看: ? 可以看出第一个是CPU内核数量,因为是4G内存,因此得出,第二个则是获取c盘容量使用情况。...11、psutil 还有个非常牛逼方法,它就是test,它可以模拟出像任务管理器一样列表,如下图所示: ? 怎么样,是不是很牛了?哈哈哈,有了这些知识做积累相信你很快就能做一个软件出出来了。

37230

如何用Python智能批量压缩图片?

本文一步步为你介绍,如何用Python自动判断多张图片中哪些超出阈值需要压缩,且保持宽高比。如果你想了解Python图像处理基础知识,欢迎动手来尝试。 ?...(由于微信公众号外部链接限制,文中部分链接可能无法正确打开。如有需要,请点击文末“阅读原文”按钮,访问可以正常显示外链版本。) 痛点 喜欢用Markdown写文稿,然后发布到不同写作平台。...终于发现了问题所在——微信公众平台对图片大小有限制。 一旦你要上传图片超过2M,就无法正常粘贴上传了。 莫非我写作文章时,还要一一检验每张插图大小?超过阈值图片压缩,然后再上传?...Python做个程序,替找出全部大于2M图片,进行压缩。压缩时候,须要保持图片宽高比例。 如果你对Python图像预处理功能比较感兴趣,不妨跟着介绍,一起试试看。...我们新建一个Python 2笔记本。 ? 这样就出现了一个空白笔记本。 ? 点击左上角笔记本名称,修改为有意义笔记本名“demo-python-resize-image”。 ?

1.8K20

python调用数组里某一个元素_python数组用法

大家好,又见面了,是你们朋友全栈君。...数组用于将多个值存储在一个变量。 示例,创建一个包含汽车名称数组: “` cars = [“Ford”, “Volvo”, “BMW”] “` ***** ## 什么是数组?...如果有项目列表(例如,汽车名称列表),则将汽车存储在单个变量可能如下所示: “` car1 = “Ford” car2 = “Volvo” car3 = “BMW” “` 但是,如果您想遍历汽车并找到特定汽车怎么办...示例,获取第一个数组项值: “` x = cars[0] “` 示例,修改第一个数组项值: “` cars[0] = “Toyota” “` ***** ## 数组长度 使用该`len()`方法返回数组长度...示例,删除`cars`数组第二个元素: “` cars.pop(1) “` 您也可以使用该`remove()`方法数组删除元素。

1.8K10
领券