首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

工作中必会的57个Excel小技巧

-数字 -自定义 -右边文框中输入三个分号;;; 3、隐藏编辑栏、灰色表格线、标和行号 视图 -显示 -去掉各项的勾选 四、单元格选取 1 、选取当前表格 按ctrl+a全选当前数据区域 2 、选取表格中的...-数据有效性 -允许 -序列 -输入A,B,C 3、复制表格保存宽不变 整行选取复制 -粘贴后点粘贴选项中的“保留宽” 4、输入到F时,自动转到下一的首列 选取A:F,输入后按回车即可自动跳转...10、快速合并多行数据 插入批注 -选取多数据复制 -粘贴到批注中,然后再从批注中复制至单元格区域中即可。...11、插入特殊符号 插入 -符号 12、查找重复 选取数据 -开始 -条件格式 -突出显示单元格规则 -重复 13、删除重复 选取区域 -数据 -删除重复项 14、单元格分区域需要密码才能编辑...、删除工作表中所有图片 ctrl+g定位 -定位条件 -对象 -删除 2、工作表插入背景图片 页面布局 -背景 -选择插入图片 3、插入可以打印的背景 插入 -页眉页脚 -选取页眉后点图片 -选取图片拖入

4K30

代码将Pandas加速4倍

虽然 panda 是 Python 中用于数据处理的库,但它并不是真正为了速度而构建的。了解一下新的库 Modin,Modin 是为了分布式 panda 的计算来加速你的数据准备而开发的。...有些库只执行跨行分区,在这种情况下效率很低,因为我们的多。...让我们在 DataFrame 上做一些更复杂的处理。连接多个 DataFrames 是 panda 中的一个常见操作 — 我们可能有几个或多个包含数据的 CSV 文件,然后必须一次读取一个连接它们。...panda 必须遍历每一和每一来查找 NaN 替换它们。这是一个应用 Modin 的绝佳机会,因为我们要多次重复一个非常简单的操作。...正如你所看到的,在某些操作中,Modin 要快得多,通常是读取数据查找。其他操作,如执行统计计算,在 pandas 中要快得多。

2.9K10
您找到你想要的搜索结果了吗?
是的
没有找到

PySpark UD(A)F 的高效使用

举个例子,假设有一个DataFrame df,它包含10亿,带有一个布尔is_sold,想要过滤带有sold产品的。...它基本上与Pandas数据的transform方法相同。GROUPED_MAP UDF是最灵活的,因为它获得一个Pandas数据允许返回修改的或新的。 4.基本想法 解决方案将非常简单。...这意味着在UDF中将这些转换为JSON,返回Pandas数据最终将Spark数据中的相应列从JSON转换为复杂类型 [2enpwvagkq.png] 5.实现 将实现分为三种不同的功能: 1)...现在,还可以轻松地定义一个可以处理复杂Spark数据的toPandas。...,并用封装类装饰 为简单起见,假设只想将为 42 的键 x 添加到 maps 中的字典中。

19.5K31

代码将Pandas加速4倍

虽然 panda 是 Python 中用于数据处理的库,但它并不是真正为了速度而构建的。了解一下新的库 Modin,Modin 是为了分布式 panda 的计算来加速你的数据准备而开发的。...有些库只执行跨行分区,在这种情况下效率很低,因为我们的多。...让我们在 DataFrame 上做一些更复杂的处理。连接多个 DataFrames 是 panda 中的一个常见操作 — 我们可能有几个或多个包含数据的 CSV 文件,然后必须一次读取一个连接它们。...panda 必须遍历每一和每一来查找 NaN 替换它们。这是一个应用 Modin 的绝佳机会,因为我们要多次重复一个非常简单的操作。...正如你所看到的,在某些操作中,Modin 要快得多,通常是读取数据查找。其他操作,如执行统计计算,在 pandas 中要快得多。

2.6K10

PyGWalker,一个用可视化的方式操作 pandas 数据集的库

PyGWalker可以简化Jupyter笔记本的数据分析和数据可视化工作流程,方法是将panda数据转换为Tableau风格的用户界面进行可视化探索。...它允许数据科学家通过简单的拖放操作分析数据并可视化模式。 安装 在使用pygwalker之前,请确保使用pip通过命令行安装软件包。...例如,您可以通过以下方式调用加载数据的Graphic Walker: df = pd.read_csv('....你可以用Graphic Walker做一些很酷的事情: 您可以将标记类型更改为其他类型以制作不同的图表,例如,折线图: 要比较不同的度量值,可以通过将多个度量值添加到/中来创建凹面视图。...若要创建由维度中的划分的多个子视图的分面视图,请将维度放入行或中以创建分面视图。规则类似于Tableau。 您可以查看表中的数据框架,配置分析类型和语义类型。

40210

【Netty】「优化进阶」(一)包半包问题及解决方案

具体来说,包现象发生是因为发送方将两个或多个数据包连续地发送到网络中,而接收方一次性读取了多个数据包,从而把它们看作一个数据处理,造成了包的现象。...而当接收到一个长度为5的数据包时,FixedLengthFrameDecoder 会暂存这个数据包,直到接收到下一数据包,然后将这两个数据包拼接在一起再进行拆分。...(1024)); LineBasedFrameDecoder 是一个解码器,它的作用是将基于的文本协议中的数据流分成一系列的。...它会扫描缓冲区中的字节,直到找到结束符号(例如 \n 或 \r\n),然后将这一段数据作为一个完整的返回。...使用 LineBasedFrameDecoder 解码器时,每个都被视为一个字符串对象,其中包含了结束符以前的所有数据

93120

Netty Review - 优化Netty通信:如何应对包和拆包挑战

这两个问题涉及到数据在传输过程中的组织和解析。 包(Packet Concatenation): 定义: 包指的是发送方发送的多个小数据包在接收方看来被组合成一个大的数据包。...可能的解决方案: 在数据包中包含长度信息,或者使用特殊的标记表示数据包的边界。 在处理包和拆包问题时,通信双方需要协调一致,以确保数据的正确性和完整性。...一个大的数据包发送,这就是所谓的TCP包和拆包问题。...tooLongFrameLength += buffer.readableBytes(); buffer.skipBytes(buffer.readableBytes()); 累加过长的长度,跳过过长的数据...通过以上代码,DelimiterBasedFrameDecoder可以根据指定的分隔符将输入的ByteBuf对象中的数据分割成一个个的。这样,就可以在后续的处理器中逐个处理这些了。

26010

Vim基础用法,最常用、最实用的命令介绍(保姆级教程)

配置文件设置set number (设置行号)set nocompatible (设置不兼容vi模式,不设置会导致许多vim特性被禁用)set clipboard=unnamed (设置普通的复制的内容和...列出当前目录所有的文件,edit后传目录名参数:find *.txt 同样是查找以txt结尾的文件保存、退出:w (保存文件):w file.txt (vim直接进入的终端,新建的文件保存,给出文件名):wq (保存退出...)yG (从当前位置复制到文件结尾)yf+(任意字符), (从当前字符复制到任意字符)yy (复制当前一整行)p (粘贴)p (粘贴到游标所在行的下方)shift + p 或者叫大写的P (粘贴到游标所在行的上方...dd (删除当前一整行)d操作后,按p,就是剪切u (撤销)u (相当于ctrl + z)ctrl + r (取消撤销,相当于ctrl + y)选中v (选中当前游标的字符)ctrl + v (选中多/...+ 任何字符, 从后往前搜索, (游标会停留在第一个匹配的字符,按n匹配下一个,shift + n 匹配上一个)/ 和 ?

1.4K00

天天做饼图,你烦不烦?老板都看腻了!

导读:怎样呈现数据,让人一看就懂?甚至眼前一亮?今天教你一招!...可这是真的 在Excel中有一个奇异的现象,被很多图表高手用来做高阶图表:图片可以直接到图表中! 选取苹果图片复制,再单击两下选中苹果柱子,按Ctrl+V即可把柱子换成苹果图片。 ?...2、按shift不松插入圆形,复制并按Ctrl+V粘贴到低柱子上,然后圆形改变成白色填充只留边线,再复制粘贴到高柱子上。 ?...3、选中实心图形,右键菜单中点“设置数据点格式,填充 - 选中层叠缩放 ? 4、在图表工具 - 设计 - 切换行/。...Excel图表可以直接到PPT中的,还可以粘贴成带链接的格式,Excel中数据更新,PPT中图表也会更新。 想要工作出色,就要有自已的特色,做数据分析报告、做图表也是这样。

91320

SocketRocket源码分析

接着来讲讲数据的读和写: 当建立连接成功后,就会循环调用这么一个方法: 记得楼主之前写过一篇即时通讯下数据包、断包处理实例(基于CocoaAsyncSocket),因此抛出一个问题,WebSocket...需要处理数据的断包和包么?...而SRWebSocket中实现的方式上彻底解决了数据包,断包的可能。...,读完才会回调给我们上层用户,所以,我们如果用SRWebSocket完全不需要考虑数据断包、包的问题,每次到达的数据,都是一条完整的数据。...,然后还是调用: 去读取真实数据的长度,然后会在下面这个方法中判断当前数据是否读取完成: 如果没读取完成,会继续去读取,否则就调用完成的方法,在完成的方法中会回调暴露给我们的代理: 并且继续去读下一数据

1.1K30

shell脚本扩展「建议收藏」

如: $ grep –A 1 panda file (从file中搜寻有panda样式的显示该行的后1) 2....如: (从file中搜寻有panda样式的显示该行的前1) $ grep -B 1 panda file 3、 -C [NUM], -NUM, –context[=NUM] 列出符合之外并列出上下各...如: (列出file中除包含panda样式的外并列出其上下2)(若要改变默认,直接改变NUM即可) $ grep -C[NUM] panda file 4、 -c, –count 不显示符合样式...接着处理下一,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。...注: 1.awk 后面接两个单引号加上大括号 {} 来设定想要对数据进行的处理动作 2.awk工作流程是这样的:先执行BEGING,然后读取文件,读入有\n换行符分割的一条记录,然后将记录按指定的域分隔符划分域

5.8K20

Socket TCP协议 实时通信的处理之Java与C++实现

目的: TCP连接面向流,读取网络的一包数据不一定正好是协议里定义的完整的一包,有可能是多包,有可能是半包,也有可能是一包半,现在要将每次读取的数据进行分包,也就是处理,提取出完整的一包数据供上层使用...这个n长度的数据内要能解析出单个完整包的长度,以便后续处理 循环:如果缓存区长度大于解析出来的完整一包的长度 执行: 取出完整一包数据后,然后剔除这包,将缓存区剩余数据放置起始位 循环里再次判断: 长度小于某个...这个n长度的数据内要能解析出单个完整包的长度,以便后续处理 如果协议定义了头,可以在取包的长度之前校验头,确保数据正确。...这里说明定义缓冲区buffer的长度大小:必须要大于可能收到的最大数据包的长度加上read读取一次网络最大数据长度 原因是缓冲区里可能剩下不到一包数据下一次读取网络数据后要将数据copy至缓冲区,如果超过缓冲区大小就无法进行处理...主要代码: Java实现: 不可用于生产环境,理解思想后根据业务数据处理包 private static int MAXDATALEN = 500000; //处理数据缓冲池的长度 private static

1.3K31

快速介绍Python数据分析库pandas的基础知识和代码示例

添加或插入行 要向DataFrame追加或添加一,我们将新创建为Series使用append()方法。...要检查panda DataFrame中的空,我们使用isnull()或notnull()方法。方法返回布尔数据名,对于NaN为真。...通常回根据一个或多个panda DataFrame进行排序,或者根据panda DataFrame的索引名称进行排序。 例如,我们希望按学生的名字按升序排序。...假设我们想按性别将分组,计算物理和化学的平均值和标准差。...我们将调用pivot_table()函数设置以下参数: index设置为 'Sex',因为这是来自df的,我们希望在每一中出现一个唯一的 values为'Physics','Chemistry

8.1K20

panda python_12个很棒的Pandas和NumPy函数,让分析事半功倍

Pandas  Pandas是一个Python软件包,提供快速、灵活和富有表现力的数据结构,旨在使处理结构化(表格,多维,潜在异构)的数据和时间序列数据既简单又直观。  ...具有标签的任意矩阵数据(同类型或异类)  观察/统计数据集的任何其他形式。实际上,数据根本不需要标记,即可放入Pandas数据结构。  ...以下是Pandas的优势:  轻松处理浮点数据和非浮点数据中的缺失数据(表示为NaN)  大小可变性:可以从DataFrame和更高维的对象中插入和删除  自动和显式的数据对齐:在计算中,可以将对象显式对齐到一组标签...,或者用户可以直接忽略标签,让Series,DataFrame等自动对齐数据  强大灵活的分组功能,可对数据集执行拆分-应用-合并操作,以汇总和转换数据  轻松将其他Python和NumPy数据结构中的不规则的...将数据分配给另一个数据时,在另一个数据中进行更改,其也会进行同步更改。为了避免出现上述问题,可以使用copy()函数。

5.1K00

提高效率 |ArcGIS Pro 中所有快捷键一网打尽

复制单元格中所选的。 Ctrl+V 粘贴所选内容。 将复制的贴到单元格。 F2 编辑单元格。 编辑当前单元格的内容。 Esc 取消操作。 取消编辑并将原始恢复到单元格。...Ctrl+空格键 选择或取消选择。 选择或取消选择当前行。 选项卡 前进到下一字段。 应用当前编辑,然后转到下一。如果在行的末尾,则转到下一的第一个单元格。...Ctrl+Enter 应用编辑并转至下一。 应用当前编辑并转至同一下一。 Shift+Enter 应用编辑并转至上一。 应用当前编辑并转至同一的上一。...选项卡 转到下一。如果在行的末尾,则转到下一的第一个单元格。 Shift+Tab 转到前一。如果在行的末尾,则转到前一的最后一个单元格。 Enter 转至同一下一。...Ctrl+V 将剪贴板中的内容粘贴到单元格或单元格区域中。 F2 编辑单元格的内容。 Enter 提交当前编辑。 Esc 取消单元格中的编辑恢复原始

89120

用 Swifter 大幅提高 Pandas 性能

编辑 | sunlei 发布 | ATYUN订阅号 假如在此刻,您已经将数据全部加载到panda数据框架中,准备好进行一些探索性分析,但首先,您需要创建一些附加功能。...Apply很好,因为它使在数据的所有上使用函数变得很容易,你设置好一切,运行你的代码,然后… 等待…… 事实证明,处理大型数据集的每一可能需要一段时间。...并行处理 几乎所有的计算机都有多个处理器。这意味着您可以很容易地通过利用它们来提高代码的速度。因为apply只是将一个函数应用到数据的每一,所以并行化很简单。...您可以将数据分割成多个块,将每个块提供给它的处理器,然后在最后将这些块合并回单个数据。 The Magic ?...可以看到,无论数据大小如何,使用向量化总是更好的。如果这是不可能的,你可以从vanilla panda那里得到最好的速度,直到你的数据足够大。一旦超过大小阈值,并行处理就最有意义。

4K20

如何成为Python的数据操作库Pandas的专家?

02 Numpy的Pandas-高效的Pandas 您经常听到的抱怨之一是Python很慢,或者难以处理大量数据。通常情况下,这是由于编写的代码的效率很低造成的。...03 通过DTYPES高效地存储数据 当通过read_csv、read_excel或其他数据读取函数将数据加载到内存中时,pandas会进行类型推断,这可能是低效的。...这些api允许您明确地利用dtypes指定每个的类型。指定dtypes允许在内存中更有效地存储数据。...04 处理带有块的大型数据集 pandas允许按块(chunk)加载数据中的数据。因此,可以将数据作为迭代器处理,并且能够处理大于可用内存的数据。 ?...在读取数据源时定义块大小和get_chunk方法的组合允许panda以迭代器的方式处理数据,如上面的示例所示,其中数据一次读取两

3.1K31

案例:用Excel对会员客户交易数据进行RFM分析

Excel操作: 鼠标点击第一标“1”以选中第一 菜单栏点击“数据”,快捷按钮栏点选“筛选” 鼠标点击“销售类型”筛选下拉按钮,可以看到所有数据集中有的销售类型 点选“销售金额”字段的小角标也可以看到有负数出现...以上我们得到了: 1)F:客户这1年共消费了多少次 2)M:客户每次交易的平均消费金额 但是,R还需要做些处理。目前R只得到的是客户最近一次消费日期,需要计算距离数据采集日期的天数。...Excel操作: 鼠标拉选标签ABCD,选中透视表所在的四 按ctrl^C(复制),点击“开始”菜单栏下,快捷按钮栏“帖”下的小下拉三角标,选择“”【或者点“选择性帖”,然后选择】,...ctrl键,继续按住shift键,按一次向上箭头,取消数据最后一的汇总数据】 点击“开始”菜单栏下快捷按钮栏上的“帖”按钮下方的下拉箭头,选择“选择性帖”,在对话框中勾选“减”,然后“确定” 在不取消目前选择的情况下...$符号还快些】 【另外一种简单的处理方式就是直接用公式“=ROUNDUP((B5-$F$2)/$F$3,0)”,然后用ctrl^H快捷操作,将0替换成1即可,这个替换需要将公式复制-快捷帖为数值后进行

2.3K50

Python进阶之Pandas入门(三) 最重要的数据流操作

通常,当我们加载数据集时,我们喜欢查看前五左右的内容,以了解隐藏在其中的内容。在这里,我们可以看到每一的名称、索引和每行中的示例。...,比如的数量、非空的数量、每个中的数据类型以及DataFrame使用了多少内存。...请注意,在我们的movies数据集中,Revenue和Metascore中有一些明显的缺失。我们将在下一讲中处理这个问题。 快速查看数据类型实际上非常有用。...处理重复 这个数据集没有重复的,但是确认您没有聚合重复的总是很重要的。...这意味着如果两是相同的,panda将删除第二保留第一。使用last有相反的效果:第一被删除。 另一方面,keep将删除所有重复项。如果两是相同的,那么这两行都将被删除。

2.6K20
领券