李伟坚(Excel催化剂):Excel离线生成词云图

在数据分析领域,词云图已经成为在文本分析中装逼的首选图表,大家热烈地讨论如何在Python上做数据分析、做词云图。

数据分析从来都是Excel的主战场,能够让普通用户使用上的技术才是最有价值的技术,一个人闷骚地写Py代码自嗨个词云图,不是笔者想要的最终效果。

所以把词云图的制作能力下放到Excel普通用户手里,就是Excel催化剂想做的事情,幸好辛苦找寻,仍然能找到一个不错的轮子,在此向大家分享一下。

具体代码

一样地可从Nuget中获取到这个轮子CloudConvert

词云图轮子CloudConvert

同样地,在Excel环境中,一个最大的优势是可以和用户进行交互,用简单窗体,让用户确认数据来源和生成过程中的一些配置信息。

用户交互窗体

核心代码如下:

  private Image GetImageFromSrcWords()
        {
            int.TryParse(this.txtPicWidth.Text, out var width);
            int.TryParse(this.txtPicHeight.Text, out var height);
            if (Width == 0 || height == 0)
            {
                throw new Exception("图片的高度或宽度设置有误,请填写正确的正整数的高度和宽度值");
            }
            Image maskImage = null;
            string[] imgExts = { ".jpg", ".png", ".jpeg" };
            string maskPath = txtMaskPath.Text;
            if (File.Exists(maskPath) && imgExts.Contains(Path.GetExtension(maskPath).ToLower()))
            {
                maskImage = Image.FromFile(maskPath);

                    if (Path.GetExtension(maskPath).ToLower() == ".png")
                {
                    var bitmap = new Bitmap(maskImage.Width, maskImage.Height);

                    bitmap.SetResolution(maskImage.HorizontalResolution, maskImage.VerticalResolution);

                    var g = Graphics.FromImage(bitmap);
                    g.Clear(Color.White);
                    g.DrawImageUnscaled(maskImage, 0, 0);
                    maskImage = bitmap;
                }
            }
            //maskImage.Save(@"F:\mask.jpg");

            var wc = new WordCloud(width: width, height: height, mask: maskImage, allowVerical: true, fontname: this.cmbFonts.SelectedItem.ToString());
            Dictionary<string, int> wordInfos = GetWordInfos();

            return wc.Draw(wordInfos.Keys.ToList(), wordInfos.Values.ToList());

        }

这个轮子可以有背景图功能maskImage,但这个图片貌似只能是一些纯黑的图标文件,其他文件识别不出来,但不是十分装逼找个乔布斯人像时,也够用,在图标库网站上下载一些纯黑的图标文件即可使用

同样地, 这个轮子貌似对于词的数量太少时,会出错,生成失真,明明频次高的字也不见得显示大,所以要告诉用户,词云图真的要在真实环境,处理大量文字的词频识别时才有效,几个词也没必要用词频图,直接条形图即可。

结语

在.Net的世界,资源也不比Python、Java这些少多少,对于普通开发者来说,没必要非要追那些看不起来多么热门的东西,在微软系里面,也有享受不尽的资源,如OFFICE,这个可以其他语言羡慕得很的一个大轮子。用好OFFICE现有功能+补充部分外界的热门资源,普通开发者也可以玩出新花样。

技术交流QQ群

QQ群名:Excel催化剂开源讨论群, QQ群号:788145319

Excel催化剂开源讨论群二维码

关于Excel催化剂

Excel催化剂先是一微信公众号的名称,后来顺其名称,正式推出了Excel插件,插件将持续性地更新,更新的周期视本人的时间而定争取一周能够上线一个大功能模块。Excel催化剂插件承诺个人用户永久性免费使用!

Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!

Excel催化剂插件下载链接:https://pan.baidu.com/s/1Iz2_NZJ8v7C9eqhNjdnP3Q

联系作者

公众号

取名催化剂,因Excel本身的强大,并非所有人能够立马享受到,大部分人还是在被Excel软件所虐的阶段,就是头脑里很清晰想达到的效果,而且高手们也已经实现出来,就是自己怎么弄都弄不出来,或者更糟的是还不知道Excel能够做什么而停留在不断地重复、机械、手工地在做着数据,耗费着无数的青春年华岁月。所以催生了是否可以作为一种媒介,让广大的Excel用户们可以瞬间点燃Excel的爆点,无需苦苦地挣扎地没日没夜的技巧学习、高级复杂函数的烧脑,最终走向了从入门到放弃的道路。

最后Excel功能强大,其实还需树立一个观点,不是所有事情都要交给Excel去完成,也不是所有事情Excel都是十分胜任的,外面的世界仍然是一个广阔的世界,Excel只是其中一枚耀眼的明星,还有其他更多同样精彩强大的技术、工具等。*Excel催化剂也将借力这些其他技术,让Excel能够发挥更强大的爆发!

关于Excel催化剂作者

姓名:李伟坚,从事数据分析工作多年(BI方向),一名同样在路上的学习者。 服务过行业:零售特别是鞋服类的零售行业,电商(淘宝、天猫、京东、唯品会)

技术路线从一名普通用户,通过Excel软件的学习,从此走向数据世界,非科班IT专业人士。 历经重重难关,终于在数据的道路上达到技术平原期,学习众多的知识不再太吃力,同时也形成了自己的一套数据解决方案(数据采集、数据加工清洗、数据多维建模、数据报表展示等)。

擅长技术领域:Excel等Office家族软件、VBA&VSTO的二次开发、Sqlserver数据库技术、Sqlserver的商业智能BI技术、Powerbi技术、云服务器布署技术等等。

2018年开始职业生涯作了重大调整,从原来的正职工作,转为自由职业者,暂无固定收入,暂对前面道路不太明朗,苦重新回到正职工作,对Excel催化剂的运营和开发必定受到很大的影响(正职工作时间内不可能维护也不可能随便把工作时间内的成果公布于外,工作外的时间也十分有限,因已而立之年,家庭责任重大)。

和广大拥护者一同期盼:Excel催化剂一直能运行下去,我所惠及的群体们能够给予支持(多留言鼓励下、转发下朋友圈推荐、小额打赏下和最重点的可以和所在公司及同行推荐推荐,让我的技术可以在贵司发挥价值,实现双赢(初步设想可以数据顾问的方式或一些小型项目开发的方式合作)。

技术交流QQ群

QQ群名:Excel催化剂开源讨论群, QQ群号:788145319

Excel催化剂开源讨论群二维码

关于Excel催化剂

Excel催化剂先是一微信公众号的名称,后来顺其名称,正式推出了Excel插件,插件将持续性地更新,更新的周期视本人的时间而定争取一周能够上线一个大功能模块。Excel催化剂插件承诺个人用户永久性免费使用!

Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!

Excel催化剂插件下载链接:https://pan.baidu.com/s/1Iz2_NZJ8v7C9eqhNjdnP3Q

取名催化剂,因Excel本身的强大,并非所有人能够立马享受到,大部分人还是在被Excel软件所虐的阶段,就是头脑里很清晰想达到的效果,而且高手们也已经实现出来,就是自己怎么弄都弄不出来,或者更糟的是还不知道Excel能够做什么而停留在不断地重复、机械、手工地在做着数据,耗费着无数的青春年华岁月。所以催生了是否可以作为一种媒介,让广大的Excel用户们可以瞬间点燃Excel的爆点,无需苦苦地挣扎地没日没夜的技巧学习、高级复杂函数的烧脑,最终走向了从入门到放弃的道路。

最后Excel功能强大,其实还需树立一个观点,不是所有事情都要交给Excel去完成,也不是所有事情Excel都是十分胜任的,外面的世界仍然是一个广阔的世界,Excel只是其中一枚耀眼的明星,还有其他更多同样精彩强大的技术、工具等。*Excel催化剂也将借力这些其他技术,让Excel能够发挥更强大的爆发!

关于Excel催化剂作者

姓名:李伟坚,从事数据分析工作多年(BI方向),一名同样在路上的学习者。 服务过行业:零售特别是鞋服类的零售行业,电商(淘宝、天猫、京东、唯品会)

技术路线从一名普通用户,通过Excel软件的学习,从此走向数据世界,非科班IT专业人士。 历经重重难关,终于在数据的道路上达到技术平原期,学习众多的知识不再太吃力,同时也形成了自己的一套数据解决方案(数据采集、数据加工清洗、数据多维建模、数据报表展示等)。

擅长技术领域:Excel等Office家族软件、VBA&VSTO的二次开发、Sqlserver数据库技术、Sqlserver的商业智能BI技术、Powerbi技术、云服务器布署技术等等。

2018年开始职业生涯作了重大调整,从原来的正职工作,转为自由职业者,暂无固定收入,暂对前面道路不太明朗,苦重新回到正职工作,对Excel催化剂的运营和开发必定受到很大的影响(正职工作时间内不可能维护也不可能随便把工作时间内的成果公布于外,工作外的时间也十分有限,因已而立之年,家庭责任重大)。

和广大拥护者一同期盼:Excel催化剂一直能运行下去,我所惠及的群体们能够给予支持(多留言鼓励下、转发下朋友圈推荐、小额打赏下和最重点的可以和所在公司及同行推荐推荐,让我的技术可以在贵司发挥价值,实现双赢(初步设想可以数据顾问的方式或一些小型项目开发的方式合作)。

本文分享自微信公众号 - 寒树Office与RPA(OfficeRPA)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-02-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏纯洁的微笑

感受 Docker 魅力, 排解决多应用部署之疼,Docker Compose + Spring Boot 实践

我知道大家这段时间看了 docker 相关的几篇文章,不疼不痒的,仍然没有感受 docker 的便利,是的,我也是这样认为的,I know your felli...

9520
来自专栏Linyb极客之路

深入剖析 MySQL 索引和 SQL 调优实战(珍藏版)

MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BTree索引,哈希索引,全文索引等等。

8920
来自专栏芋道源码1024

一千行 MySQL 详细学习笔记

来源:shockerli.net/post/1000-line-mysql-note/

11420
来自专栏AustinDatabases

MYSQL 8 数据导出导入怎么更快 与 阻止最大权限删库

MySQL 的数据导出导入其实从MYSQL 5.5 到 5.7 大部分采用的方法有如下几种

10120
来自专栏知了一笑

微服务架构案例(06):通过业务、应用、技术、存储方面,聊聊架构

架构分类可细化的分为业务架构、应用架构、技术选型、代码规划、部署环境架构等。业务架构是核心的驱动力,应用架构是实现的思路,技术选型落地是结果。根据用户需求,设计...

10820
来自专栏Java研发军团

面试官:如果让你写一个MyBatis分页插件,你准备怎么实现?

PageHelper是一款好用的开源免费的Mybatis第三方物理分页插件,其实我并不想加上好用两个字,但是为了表扬插件作者开源免费的崇高精神,我毫不犹豫的加上...

12520
来自专栏生信技能树

gpl16699平台的探针注释到基因名(十一月学徒投稿)

现在我完成作业就遇到了gpl16699平台,它并没有bioconductor的包,所以需要下载gpl平台的soft文件,进行注释,官网https://www.n...

14310
来自专栏小麦苗的DB宝专栏

【DB笔试面试681】在Oracle中,什么是块清除(Block Cleanout)?

块清除(Block Cleanout)是指清除存储在数据块头部与锁相关的信息,其实质是在清除块上的事务信息,包括数据的行级锁和ITL信息(包括提交标志、SCN等...

9010
来自专栏Linyb极客之路

深入浅出分析MySQL索引设计背后的数据结构

对于这项规定,很多研发小伙伴不理解。本文就来深入简出地分析MySQL索引设计背后的数据结构和算法,从而可以帮你释疑如下问题:

6920
来自专栏志学Python

带你认识 flask 中的数据库

Flask本身不支持数据库,相信你已经听说过了。正如表单那样,这也是Flask有意为之。对使用的数据库插件自由选择,岂不是比被迫适应其中之一,更让人拥有主动权吗...

6620

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励