前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用FME进行属性挂接之(二)

使用FME进行属性挂接之(二)

作者头像
数据处理与分析
发布2019-07-31 16:36:28
1.6K0
发布2019-07-31 16:36:28
举报

如何在FME中进行数据的清洗

在FME中进行数据清洗还算是比较方便的,借助强大的转换器与Python,可以很方便的完成特殊字符的清理、别字的替换、全角半角互转等。而这方面要用到的转换器就是:StringReplacer与PyCaller。 使用这两个转换器可以轻松完成数据的清洗,简单的替换我们可以使用正则,或者是直接用字符串进行替换,这都是可以的。接下来,我们讲一讲上一次推送中使用到的数据清洗

菜名数据清洗

先来看一下菜名

如下图所示,总的来说都是以逗号分隔,但是其中也有例外

清洗规则

针对这部分数据我们使用如下的表达式进行数据的清洗

图中表达式的含义为:将所有不是汉字的字符都替换为顿号。 经过这样的处理,我们就可以在接下来的处理中按照统一的分隔符对数据进行拆分。方便我们后续的挂接操作。

结语

最近的工作比较忙,很少能有时间能坐下来安安静静的写点文字!接下来的时间里也会很忙,所以为了便于技术的交流,可以加入QQ群与我或者群里的各路大神更好的沟通。 周末愉快啊!各位!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-07-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据处理与分析 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 如何在FME中进行数据的清洗
  • 菜名数据清洗
    • 先来看一下菜名
    • 清洗规则
    • 结语
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档