前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Power Query中数据分割函数详解(3)

Power Query中数据分割函数详解(3)

作者头像
逍遥之
发布2020-03-23 17:40:51
1K0
发布2020-03-23 17:40:51
举报
文章被收录于专栏:数据技巧

Table.SplitColumn(table as table, sourceColumn as text,splitter as function,optional columnNamesOrNumber as any, optional default as any, optional extraColumns as any) as table

参数1代表需要操作的表;参数2代表需要分割的文本字段,是一个文本格式;参数3是分割操作的函数,可用的分割函数有9个;参数4是拆分后生成的列数或者字段名称的列表;参数5是用于替换拆分后为空值的值;参数6是展开后的类型,可以为列表。

参数3的操作函数主要有以下几个。

1. Splitter.SplitTextByRanges

Splitter.SplitTextByRanges(ranges as list, optionalsrartAtEnd as nullablelogical) as function

返回根据指定偏移量和长度将文本拆分为文本列表的函数。第1参数为偏移的列表;第2参数为是做起始和结束的判断,默认是false。请注意第1参数实则为列表嵌套格式,也就是{{偏移量,提取字符数},{偏移量,提取字符数}},此外此函数可以重复提取,针对既想保留原字符又想做拆分的话会比较便捷。

例:

Table.SplitColumn(源,"学科",Splitter.SplitTextByRanges({{0,10},{0,4}}))=

解释:第1个列表内因为是从0位置提取,也就是从最左边提取,首先提取10个字符作为第1个拆分字段,因为原本的字符数小于10,相当于保留原字符格式。第2个列表是从0开始提取4个字符,也就是从最初位置提取4个字符。

Table.SplitColumn(源,"学科",Splitter.SplitTextByRanges({{1,2},{0,4}},true))=

解释:因为第2参数是true(默认是false),如果是true,则列表的提取顺序反过来,也就是从尾开始先按{0,4}列表提取,"新概念基础英语"的最后开始提取4位;然后在按{1,2}列表提取,"新概念基础英语"从尾部第1位置提取2位也就是"础英"2个字符。

2. Splitter.SplitTextByRepeatedLengths

Splitter.SplitTextByRepeatedLengths(length as number, optionalstratAtEnd as nullablelogical) as function

按指定长度后反复将文本拆分为文本列表的函数。第1参数是文本长度;第2参数是起始和结束的判断。可以理解为按固定的字符数来拆分。可以为空值代表不拆封保留原值,如果为0则代表拆分后的结果为空文本。如果最后拆分的字符不满足固定字符数,则会省略。还有个细节要注意,拆分后生成的字段以第一个数据为基础。

例:

Table.SplitColumn(源,"学科",Splitter.SplitTextByRepeatedLengths(1))=

释:指定固定1个字符数来拆分文本。因为第1个字符是4个字符,所以按1个字符拆分的话,拆分结果是4个字段。

Table.SplitColumn(源,"学科",Splitter.SplitTextByRepeatedLengths(2))=

释:指定固定2个字符数来拆分文本。因为第1个字符是4个字符,所以按2个字符拆分的话,拆分结果是2个字段。

Table.SplitColumn(源,"学科",Splitter.SplitTextByRepeatedLengths(3,true))=

解释:因为第2参数是true,所以是从后往前进行拆分,也就是先提取最后3个字符,然后依次往前提取剩余的,同时因为第1个拆分文本"高等数学"是4个字符,所以按3个字符拆分后只会生成2个字段,往前推剩余的也就是"高"这1个字符。我们可以把字段加出来就可以更加的理解了。

3. Splitter.SplitTextByWhitespace

Splitter.SplitTextByWhitespace(optional quoteStyle as nullableQuoteStyle.Type) as function

返回按空白处将文本拆分成文本列表的函数。只有1个参数为可选参数,判断是否对csv格式文件的"做处理。需要注意的是如果是连续多个空白处是作为一处分割来处理

例:

Table.SplitColumn(源,"姓名",Splitter.SplitTextByWhitespace())=

解释:参数未写,则默认为1代表不处理,也就是把"张 三"是作为单个字符来处理,也就是空白的地方不作为单独字符,所以为产生拆分。

Table.SplitColumn(源,"姓名",Splitter.SplitTextByWhitespace(0))=

因为第2参数为0,所以"是作为一个字符来处理,即使是有2个空白,但是因为是连续的,所以也就按1个空白处理进行拆分。

至此我们把分割函数Table.SplitColumn的第3参数给介绍完了,当然我们之前在介绍的时候也有包括介绍了其第4参数

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据技巧 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. Splitter.SplitTextByRanges
  • 2. Splitter.SplitTextByRepeatedLengths
  • 3. Splitter.SplitTextByWhitespace
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档