个人永久性免费-Excel催化剂功能第75波-标签式报表转标准数据源

数据处理永远是数据分析工作中重中之重的任务,大部分人深深地陷入在数据处理的泥潭中,今天Excel催化剂再接再厉,在过往已提供了主从结构报表数据源的数据转换后,再次给大家送上标签式报表数据源的数据转换操作。

业务场景

日常面对的数据源多种多样,其中一个很大的渠道是从网络上采集数据源,网页上展示的数据结构,它不太可能是规范的数据库表结构的数据源,更多的是标签式的数据结构展现。

标签式数据结构,即一个列表清单,如商品搜索页呈现的多个商品重复铺排,或博客里的目录、信息流里的数据等,都是一个数据单元,不断地重复出现,而其单元内是一对一的关系,不会出现之前提及的主从结构的数据(有一个表头+多条明细数据)。

淘宝搜索页多个商品标签式排列

博客类信息流文章清单

对于这样的数据源,我们作为分析的角度,更希望是如下的数据结构,其中右侧黄色区域是根据左侧的源信息用函数公式提取出来的信息。

标准可用于分析的数据库表结构

现有的各种网抓方法,固然可以最终拿到自己想要的数据结构,但动不动就网抓,也不是件轻松的事件,特别是对一些临时性的需求,用完即走的,花大力气来写个网抓程序,成本太高,收益甚微

Excel催化剂带给广大用户的便捷之道

一般普通用户,不要说网抓这么高技术水平的活,普通个VBA自动化操作估计都难倒不少人。何况现在网抓与反网抓斗争白热化,普通的业余开发者可能也未能轻松得到想要的数据,特别是大型电商平台的数据,反网抓做得很深入。

Excel催化剂呈现的方法是永恒的简单之道,复制粘贴,人人皆会的操作步骤。只需打开自己想要的数据网页,CTRL+A全选网页或选择指定内容复制下,粘贴到Excel工作表中,再做简单的配置工作,完事!

功能说明

以上提及的是网页数据转换的小场景,可能还有部分场景是系统导出的数据也是这样的结构(不要把系统开发者想得多有智慧,通常很多时候他们都会画蛇添足地把用户想要的数据进行加工转换,变成用户十分厌恶的不能马上可用于分析的数据)。概括来说,适用于各种标签式结构的数据源的转换。

功能入口

步骤1:按要求准备数据源

若是网页的数据,需要自行复制粘贴到Excel工作表中,这过程,有两种形式的粘贴,一种是保留格式,一种是不保留格式,按需使用。

鼠标右键粘贴时,红框为普通粘贴,保留格式和图片等,而蓝框的是文本粘贴,不保留格式,也不会有图片,粘贴速度也快,可能丢失某些字体颜色、超链接等关键信息。

粘贴完后,若图片遮挡查看内容,可用F5定位删除图片(自行百度方法)。

粘贴的两种方式

若需要用普通粘贴,建议先把A列拉宽,一般粘贴过来的内容都大部分存放在A列中。

复制网页数据粘贴到Excel工作表中

无格式粘贴,速度快

步骤2:配置映射关系

点击配置映射关系后,出现配置工作表,如下图所示,按要求整理好配置信息。

定位单元格是用于定位标签的数据单元,可用普通查找和正则查找两种

同样内容列相对定位单元格的位置,自行查阅数据源进行位置定位。

配置信息整理步骤2:生成结果表

针对本工作薄操作或需要遍历多个其他工作薄,选择对应的不同第2步按钮即可,选定工作薄路径,可使用自定义函数取到需要遍历提取的所有工作薄的路径,选择对应的单元格区域,再点击按钮。

选择所需遍历的数据源工作薄路径单元格

保留格式粘贴的情况下,最终复制汇总到结果表中,仍然保留其格式,可使用Excel催化剂开发的大量对Excel对象进行访问的自定义函数,取到自己想要的格式信息。同时也可使用文本类自定义函数,正则自定义函数,对取到的数据源进行加工抽取到所需的信息,如黄色区域的阅读数、评论数等

带格式复制的结果表样式

自定义函数访问Excel对象属性

结语

从此篇中,也可见识到,数据只需进入到Excel环境,不管原有的数据结构如何千变万化,只要能够抽象出共性规律,借助插件等手段,仍然可以得到自己想要的数据。

对于业务方向的Excel用户来说,更需要的是如何摆脱固有思维,让自己可以更加发散性地寻求更好的解决方案,有规律的事务,提炼出逻辑,转化为技术逻辑,供专业的人帮忙解决,而不局限于机械式的重复操作。

系列文章

一文带你全面认识Excel催化剂系列功能

安装过程详解及安装失败解决方法

第1波-工作表导航

第2波-数字格式设置

第3波-与PowerbiDesktop互通互联

第4波-一大波自定义函数高级应用,重新定义Excel函数的学习和使用方法

第5波-使用DAX查询从PowerbiDeskTop中获取数据源

第6波-导出PowerbiDesktop模型数据字典

第7波-智能选区功能

第8波-快速可视化数据

第9波-数据透视表自动设置

第10波-快速排列工作表图形对象

第11波-快速批量插入图片

第12波-快速生成、读取、导出条形码二维码

第13波-一键生成自由报表

第14波-一键生成零售购物篮分析

第15波-接入AI人工智能NLP自然语言处理

第16波-N多使用场景的多维表转一维表

第17波-批量文件改名、下载、文件夹创建等

第18波-在Excel上也能玩上词云图

第19波-Excel与Sqlserver零门槛交互-查询篇

第20波-Excel与Sqlserver零门槛交互-数据上传篇

第21波-Excel与Sqlserver零门槛交互-执行SQL

第22波-Excel文件类型、密码批量修改,补齐Power短板

第23波-非同一般地批量拆分工作表

第24波-批量发送邮件并指点不同附件不同变量

第25波-小白适用的文本处理功能

第26波-正确的Excel密码管理之道

第27波-Excel工作表设置快捷操作

第28波-工作薄瘦身,安全地减少非必要冗余

第29波-追加中国特色的中文相关自定义函数

第30波-工作表快捷操作(批量创建、命名、排序、工作表目录)

第31波-数量金额分组凑数功能,财务表哥表姐最爱

第32波-空行空列批量插入和删除

第33波-报表形式数据结构转标准数据源

第34波-提取中国身份证信息、农历日期转换相关功能

第35波-Excel版最全单位换算,从此不用到处百度找答案

第36波-新增序列函数用于生成规律性的循环重复或间隔序列

第37波-把Sqlserver的强大分析函数拿到Excel中用

第38波-比Vlookup更好用的查找引用函数

第39波-DotNet版的正则处理函数

第40波-工资、年终奖个人所得税计算函数

第41波-文件文件夹相关函数

第42波-任意字符指定长度随机函数

第43波-文本处理类函数增强

第44波-可见区域复制粘贴不覆盖隐藏内容

第45波-逻辑判断函数增强

第46波-区域集合函数,超乎所求所想

第47波-VBA开发者喜爱的加密函数类

第48波-拆分工作薄内工作表,堪称Excel界的单反

第49波-标准数据结构表转报表样式结果

第50波-批量打印、导出PDF、双面打印功能

第51波-聚光灯功能,长宽工作表不看错位使用

第52波-相同内容批量合并单元格,取消合并单元格并填充内容

第53波-无比期待的合并工作薄功能

第54波-批量图片导出,调整大小等

第55波-Excel批注相关的批量删除作者、提取所有批注信息等

第56波-获取Excel对象属性相关自定义函数

第57波-一键生成完全组合的笛卡尔积结果表

第58波-批量生成单选复选框

第59波-快速调用Windows内部常用工具命令

第60波-数据有效性验证增强版,补足Excel天生不足

第61波-快速锁定解锁单元格及显示隐藏公式

第62波-单元格区域内数据加解密处理,最有效地保护数据方式

第63波-当前选择区域的上下左右平移功能及跳转窗口左上角

第64波-多级数据如省市区联动输入,自由配置永不失效

第65波-数据区域转换指定规格的多行或多列

第66波-数据快速录入,预定义引用数据逐字提示

第67波-父子结构表转换添加辅助信息之子父关系篇

第68波-父子结构表转换之父子关系BOM表拆分篇

第69波-打造最专业易用的商务图表库

第70波-工作薄外部链接维护管理

第71波-定义名称管理器维护增强

第72波-序列规则下的数据验证有效性好帮手:快速录入窗体辅助录入

第73波-数据转换:单行多项目转多行单项目

第74波-批量排版格式利器,瞬间美化表格

关于Excel催化剂

Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181226A0N9ST00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券