表算子

最近更新时间:2023-12-07 16:36:34

我的收藏
注意:
部分输出请在高级设置中查看。

SelectColumn

原理

算法说明

类似 SQL 中的 SELECT 操作。

参数配置

算法 IO 参数
*输入文件类型:格式包括以下两种:
csv :csv 文件
*输入数据包含 header 信息:默认为“是”。
*输入数据分隔符:数据分隔符,默认为逗号,可下拉选择其他分隔符。
*输出数据包含 header 信息:默认为“是”。
*输出数据分隔符:数据分隔符,默认为逗号,可下拉选择其他分隔符。
parquet :列式存储格式 parquet
*选择特征列:检测的特征列,从 0 开始计数,例如:单列 2 ,多列 0-2 。

Demo

输入数据示例

csv 文件,每一列分别代表购物记录 ID ,商品 ID ,买家 ID ,购买的时间戳。
id,goods_id,buyer_id,create_time
1,000001,1,1611800377
2,000002,2,1611800977

参数配置

算法 IO 参数
*输入文件类型:csv
*输出数据是否包含 header 信息:是
*输出文件分隔符:逗号
*输入数据是否包含 header 信息:是
*输入文件分隔符:逗号
*选择特征列:1

输出数据示例

输出为 csv 文件。
goods_id
1
2