利用Excel收集数据时,如果事先没有对数据录入作出统一的规范性限制,就可能会收集到一些不统一的数据。
以上图中C列的学校名称为例,既有简称,也有全称,而且各种简称的信息也不完全一致,面对这样的表格,如果数据量很大,要在其基础上进行数据查询、数据分析之类的工作,名称不统一的问题是一个较大的麻烦。
很多时候,可能需要通过公式或其他方法求两个名称的相似度,通过相似度的高低来判断两个名称指的是否为同一个事件。
Excel中没有现成的函数可以求两个文本的相似度,我们可以使用VBA来写一个自定义函数帮助解决类似的问题:
在Excel的VBE编辑器中新建一个模板,将以上代码复制、粘贴到模块中。
再回到Excel中,就能像使用普通函数一样使用自定义函数求两个文本的相似度了。
求得文本的相似度之后,根据自定义的标准,再借助其他函数,就能判断两个文本是否同一个内容,进行进行内容的修正了。
关注“Excel笔记”,学最适用的Excel技巧。
领取专属 10元无门槛券
私享最新 技术干货