首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python办公自动化』Excel:红低于100数据

本文简介 作为产品经理,收集和分析数据是必备技能。我们产品可能会设置埋点监听用户行为、记录页面和某些功能使用情况。你问研发同事拿埋点数据,研发同事可能会导出一份 Excel 给你。...此时如果你想红使用量少于100数据,可以在Excel里操作,也可以使用 Python 去处理。本文介绍后者。...在此之前你需要掌握 Python 基础语法,不了解 Python 工友可以查阅 《Python 快速入门篇》。...动手操作 用 Python 实现上述需求只需4步: 下载并导入 openpyxl 加载 Excel 文件(本例统计表叫 “功能使用量统计.xlsx” ) 遍历并红数值小于100数据 保存文件 首先打开...in row: # cell是单元格对象,要获取值需要访问 value 属性 if cell.value < 100: # 判断如果 cell 中

8610

3招降服Python数据None

只要和数据打交道,就不可能不面对一个令人头疼问题-数据集中存在空。空处理,是数据预处理之数据清洗重要内容之一。...Python 数据分析包 Pandas 提供了一些便利函数,可以帮助我们快速按照设想处理、解决空。 空处理第一招:快速确认数据集中是不是存在空。...说到空,在 NumPy 中定义为: np.nan,Python 中定义为 None,所以大家注意这种表达方式。...从上一个有效数据传播到下一个有效数据行。此外,还有一个限制连续空数量关键字 limit....---- 推荐阅读: 15个Python数据分析函数 为人要厚道,做事凭良心。悟天道酬勤,自信:心怀美好,美好即至。近日,细分微信群,仅一步操作,寻与汝同行之人,邀您加入!

1.1K30
您找到你想要的搜索结果了吗?
是的
没有找到

github星58500+:常见数据结构与算法python实现

昨天分享文章介绍了如何学习数据结构算法: leetcode 刷500道题,笔试/面试稳吗?谈谈算法学习 今天介绍一个 github 仓库,用 Python 实现了常见数据结构与算法。...另外,前几天红包抽奖,今晚就开奖了,还没参与,赶紧点进来: 20个常用Python小技巧 ---- 有人问我数据结构与算法怎么学?...以上两个教程都不是用python实现,有群友问怎么用python实现常见数据结构算法?...我找到一个github星58500+star仓库,把各种常见算法用python实现了,而且还有动图演示,非常值得推荐。...(github星12000+,提供百度云镜像) 吴恩达深度学习笔记及视频等资源(github星8500+,提供百度云镜像) 《统计学习方法》python代码实现(github星7200+) 精心整理和翻译机器学习相关数学资料

3.2K30

Github星66.6k+:常见数据结构与算法Python实现

有人问我数据结构与算法怎么学? 怎么用Python实现常见数据结构算法?我找到一个github星66.6k+仓库,把各种常见算法用Python实现了,而且还有动图演示,非常值得推荐。...仓库地址: https://github.com/TheAlgorithms/Python 内容说明 包含了常见算法Python实现,如二叉树、排序、查找等等。...推荐三个我学过课程: 免费我推荐严蔚敏老师数据结构课程,网上可以查到,用C语言实现,当年考博士时候学就是这个。...视频下载链接:https://pan.baidu.com/s/1O3W85I13gJRI2YsY8boTrw 提取码:unm7 收费我推荐王争老师数据结构与算法之美》: http://gk.link...总结 本文推荐Github上一个星66.6k+仓库,把各种常见算法用Python实现了,而且还有动图演示。

1.5K30

Python求取Excel指定区域内数据最大

本文介绍基于Python语言,基于Excel表格文件内某一列数据,计算这一列数据在每一个指定数量范围内(例如每一个4行范围内)区间最大方法。   ...已知我们现有一个.csv格式Excel表格文件,其中有一列数据,我们希望对其加以区间最大计算——即从这一列数据部分(也就是不包括列名部分)开始,第1行到第4行之间最大、第5行到第8行最大...、第9行到第12行最大等等,加以分别计算每4行中最大;此外,如果这一列数据个数不能被4整除,那么到最后还剩余几个,那就对这几个加以最大求取即可。   ...在函数中,我们首先读取文件,将数据保存到df中;接下来,我们从中获取指定列column_name数据,并创建一个空列表max_values,用于保存每个分组最大。...在每个分组内,我们从column_data中取出这对应4行数据,并计算该分组内最大,将最大添加到max_values列表中。最后,函数返回保存了每个分组最大列表max_values。

11020

Python】基于某些列删除数据框中重复

Python按照某些列去重,可用drop_duplicates函数轻松处理。本文致力用简洁语言介绍该函数。...二、加载数据 加载有重复数据,并展示数据。...导入数据处理库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中重复') #把路径改为数据存放路径 name = pd.read_csv('name.csv...从结果知,参数为默认时,是在原数据copy上删除数据,保留重复数据第一条并返回新数据框。 感兴趣可以打印name数据框,删重操作不影响name。...但是对于两列中元素顺序相反数据框去重,drop_duplicates函数无能为力。 如需处理这种类型数据去重问题,参见本公众号中文章【Python】基于多列组合删除数据框中重复。 -end-

18.1K31

图解NumPy:常用函数内在机制

点击 机器学习算法与Python学习 ,选择加星 精彩内容不迷路 选自Medium,作者:Lev Maximov 机器之心编译 支持大量多维数组和矩阵运算 NumPy 软件库是许多机器学习开发者和研究者必备工具...NumPy 是一个基础软件库,很多常用 Python 数据处理软件库都使用了它或受到了它启发,包括 pandas、PyTorch、TensorFlow、Keras 等。...(其中 .5 会被舍掉) NumPy 也能执行基础统计运算: NumPy 排序函数没有 Python 排序函数那么强大: Python 列表与 NumPy 数组排序函数对比 在一维情况下,如果缺少...为了获取适用于任意维度通用符号,NumPy 引入了 axis 概念:事实上,axis 参数是相关问题中索引数量:第一个索引为 axis=0,第二个索引为 axis=1,以此类推。...它们硬编码了 (y,x,z) 索引顺序,即 RGB 图像顺序: NumPy 使用 (y,x,z) 顺序示意图,堆叠 RGB 图像(这里仅有两种颜色) 如果你数据布局不同,使用 concatenate

3.2K20

Python】基于多列组合删除数据框中重复

最近公司在做关联图谱项目,想挖掘团伙犯罪。在准备关系数据时需要根据两列组合删除数据框中重复,两列中元素顺序可能是相反。...本文介绍一句语句解决多列组合删除数据框中重复问题。 一、举一个小例子 在Python中有一个包含3列数据框,希望根据列name1和name2组合(在两行中顺序不一样)消除重复项。...二、基于两列删除数据框中重复 1 加载数据 # coding: utf-8 import os #导入设置路径库 import pandas as pd #导入数据处理库...import numpy as np #导入数据处理库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中重复') #把路径改为数据存放路径 df =...numpy as np #导入数据处理库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中重复') #把路径改为数据存放路径 name = pd.read_csv

14.6K30

浅析python表达式4+0.5数据类型

python中表达式4+0.5数据类型为? 表达式中4是整数、0.5是浮点数,所以它们相加类型是浮点型。...知识点扩展: Python中整数和浮点数 Python支持对整数和浮点数直接进行四则混合运算,运算规则和数学上四则运算规则完全一致。...+ – * / 使用括号可以提升优先级,这和数学运算完全一致,注意只能使用小括号,但是括号可以嵌套很多层 和数学运算不同地方是,Python整数运算结果仍然是整数,浮点数运算结果仍然是浮点数...不过,Python提供了一个求余运算 % 可以计算余数: 11 % 4 # == 3 如果我们要计算 11 / 4 精确结果,按照“整数和浮点数混合运算结果是浮点数”法则,把两个数中一个变成浮点数再...运算就没问题了: 11.0 / 4 # == 2.75 以上就是浅析python表达式4+0.5数据类型详细内容,更多关于python中表达式4+0.5数据类型资料请关注ZaLou.Cn

60010

Python算法与数据结构--求所有子数组最大

数组中连续一个或多个整数组成一个子数组,每个子数组都有一个和。 求所有子数组最大。要求时间复杂度为O(n)。...这个题目有多个解法,比如可以用一个二维数组存之前每个数据和,然后在进行大小比较;但是这样时间负责度就是O(n2)了。 换个思路思考下,因为是要最大数,那么就不需要存储,只需要找最大就可以了。...数组中连续一个或多个整数组成一个子数组,每个子数组都有一个和。 求所有子数组最大。要求时间复杂度为O(n)。...基本思路:一个数一个数相加,相加后和最大数以及当前这个数对比,找出最大;如果相加后是负数,则累加清零 """ if __name__ == "__main__": #初始化数组,测试数据...,一旦累加值是负数,则清零 pre_data = dataList[0] #用来记录最大 max_data = pre_data #遍历数据组进行累加和大小对比

1.7K20

Python实现自动问答系统(毕设源码)

2、构建知识图谱 修改const.py文件中连接数据库使用URI,USERNAME和PASSWORD。然后执行: python build_cakg.py 运行大约需要2~5分钟。...将结构和两种关系拆开: 从结构关系来看,不用一个年度录入一个年度所有指标,每个年度中肯定有重复指标,这样避免了数据冗余。...若每年指标位置基本不变,则上述做法直接可行,但实际上指标出现位置可能每年都飘忽不定,所以若直接按上述做法会出现这种情况: 假设2012年指C1包含指标A、B,指标C2包含指标C;2013年指C1...从关系来看,问题中也是直接给出年份和指标名称,这样也方便查询。...指标角度 对问题中指标名进行替换,避免因错字漏字而特征词识别不成功。通过Levenshetin算法实现对指标名模糊查询。

97110

Python绘制hist直方图使用手册

对于初学python绘图小伙伴来说,彻底弄清hist直方图绘制需要花费较多时间。 本文旨在让你花最少时间,彻底弄懂hist函数原理和绘制方法。 本文目录 什么是直方图?...频率分布直方图:在统计数据时,按照频数分布表,在平面直角坐标系中,横轴标出每个组端点,纵轴表示频率除以组距,每个矩形高代表频率和组距商。 频数:落在各组样本数据个数。...组距:直方图中柱子宽度,可自定义,也可用数据最大减去最小再除以柱子个数。...若为数值序列,则该序列给出每个柱子范围,除最后一个柱子外,其他柱子取值范围均为左闭右开,若数值序列最大小于原始数据最大,存在数据丢失。 range:元组或None,默认为None。...当图中有多个数据集时使用该参数,若取值为True,则输出数据集累计堆叠结果,若取值为False,则多个数据集柱子并排排列。

3.5K11

论文拾萃|利用GLAH算法解决集装箱翻箱问题

我们对不同block优先度进行排序,由1,...,N组成,其中1优先度最大。若CRP问题中,若一个优先度仅对应一个block,则被分为simplex instances。...因此我们将Bad-X relocation中成功使目标block处于该堆叠中最顶层为freeing target (FT) Bad-X,而将没能成功将目标解放移动,为non-freeing target...我们希望最小优先度变化越小越好,因为这意味着优先度相近箱子被放在了一个堆叠上,且优先度最高被放在了最上面,是较为理想情况。根据这一指对所有FT-BG和NT-BG移动进行升序排列。...根据这一指对所有FT-BB与NT-BB移动进行升序排列。...欲入群,请转发此文,然后扫描下方二维码联系数据魔术师小助手

1.1K41

Python 为什么没有 void 关键字?

(给机器学习算法与Python学习加星,提升AI技能) void 是编程语言中最常见关键字之一,从字面上理解,它是“空、空集、空白”意思,最常用于表示函数一种返回类型。...以 Python 几种常见类型为例,我们可以从对比中看出规律:int 是一种表示整数类型,它有无限个可能整数值;bool 是一种布尔类型,它有两个可能(True 和 False);NoneType...至于 void,它是一种更为抽象特殊类型,但是不包含任何。 介绍完概念上含义,我们就可以进入正题了。标题中问题可以进一步分解成两个: 其它语言为什么要使用 void 关键字?...试想一下,如果 Python 不让函数默认有返回的话,就可能要写成 void def func():... 这样形式,那它就变成了函数定义时一种特例。...总体而言,Python 似乎认为 void 空类型不是那么有存在必要,似乎 NoneType 类型就足够了,而当缺少返回时,让解释器统一注入是极为方便,因此才出现了我们看到现状。

79310

Python 数据处理 合并二维数组和 DataFrame 中特定列

numpy 是 Python 中用于科学计算基础库,提供了大量数学函数工具,特别是对于数组操作。pandas 是基于 numpy 构建一个提供高性能、易用数据结构和数据分析工具库。...在这个 DataFrame 中,“label” 作为列名,列表中元素作为数据填充到这一列中。...print(random_array) print(values_array) 上面两行代码分别打印出前面生成随机数数组和从 DataFrame 提取出来组成数组。...结果是一个新 NumPy 数组 arr,它将原始 DataFrame 中 “label” 列作为最后一列附加到了随机数数组之后。...运行结果如下: 总结来说,这段代码通过合并随机数数组和 DataFrame 中特定列,展示了如何在 Python 中使用 numpy 和 pandas 进行基本数据处理和数组操作。

5600

图解NumPy:常用函数内在机制

NumPy 是一个基础软件库,很多常用 Python 数据处理软件库都使用了它或受到了它启发,包括 pandas、PyTorch、TensorFlow、Keras 等。...(其中 .5 会被舍掉) NumPy 也能执行基础统计运算: NumPy 排序函数没有 Python 排序函数那么强大: Python 列表与 NumPy 数组排序函数对比 在一维情况下,如果缺少...则不会对要比较数进行任何假设,而是依赖用户给出合理 abs_tol (对于典型 1 范围内,取默认 np.allclose atol 1e-8 就足够好了):math.isclose...为了获取适用于任意维度通用符号,NumPy 引入了 axis 概念:事实上,axis 参数是相关问题中索引数量:第一个索引为 axis=0,第二个索引为 axis=1,以此类推。...它们硬编码了 (y,x,z) 索引顺序,即 RGB 图像顺序: NumPy 使用 (y,x,z) 顺序示意图,堆叠 RGB 图像(这里仅有两种颜色) 如果你数据布局不同,使用 concatenate

3.6K10

Python 爬虫进阶必备 | 某行业研究数据返回加密分析

今日网站 aHR0cHM6Ly93d3cuaGFuZ2hhbmdjaGEuY29tL2FnZW5jeS10aW1pbmc= 这个站是返回加密,写出来就是图个乐呵,毕竟做企业信息查询还是头部两家给力,...加密定位 可以看到请求返回中data部分是加密 这个时候切换到Initiator选项卡,可以看到这个请求调用过程 “除了上面的方法之外,根据请求类型也可以选择是否使用 xhr 断点调试方式找到加密...通过分析堆栈可以在feachData位置找到解密代码 打上断点可以看到e位置就是请求返回内容 并且在下一行代码就是明文了 所以整个解密逻辑就在c["a"].decrypt()中 加密分析...重新刷新,在c["a"].decrypt()位置重新单步进去 可以看到下面的逻辑 这个逻辑代码就很清晰了 我们直接按照之前教三要素就可以自己重写这个解密了 1、密钥 就是上面的三个常量拼接出来字符串...2、填充模式是pkcs7 3、ECB 模式 知道这几个要素,我们在 Python 还原一下这个解密过程 import base64 from Crypto.Cipher import AES encryptData

40010

石头、剪刀、布!10分钟带你打开深度学习大门,代码已开源

在这个问题中,我们需要大量(x,y)数据对来进行训练,也就是大量(图像,手势)数据对,如(图像1,剪刀)、(图像2、石头)、(图像3、布)…… 这些数据对往往需要由人为搜集、标注得到。...一个显见想法是,我们把训练数据当做网页中图片,读进DOMimg元素中。我们先将训练数据中每一张图像“拉直“成1像素高图像,再将所有图像一行一行堆叠在一起。...这个网页应用作者提供了生成sprite-sheetPython代码,在github仓库根目录spritemaker文件夹下。 ?...,它们就是这个问题中我们对于模型评价指标。...准确率表格中,每一行是一个手势类别的准确率;矩阵中,手势X行和手势Y列确定单元格代表实际是手势X,被算法认为是手势Y图像数量,这样矩阵我们叫做“混淆矩阵”,因为它展现了算法对于两两手势容易搞混程度

1.1K10

python自动化办公:玩转word之页眉页脚秘笈

节将就python操作word页眉页脚技巧做深入介绍。 使用页眉和页脚 python操作word页眉页脚技巧做深入介绍 Word支持页眉和页脚。...实际头定义存在表示为_Header.is_linked_to_previous: >>> header.is_linked_to_previous True 为True表示对象不包含标题定义,该节将显示与上一节相同标题...缺少头定义部分会继承之前部分头。当存在定义而不存在_Header.is_linked_to_previous定义时,该属性仅反映头定义False存在True。 3....缺少头定义是默认状态。新文档没有已定义标题,也没有新插入部分。.is_linked_to_previous报告 True这两种情况。 4....添加标题定义(一般情况) 可以通过赋予False其.is_linked_to_previous属性来为缺少一个节节提供显式头定义 : >>> header.is_linked_to_previous

4K30
领券