我正在使用teradata处理一个数据集,该数据集具有以下格式的多次数据:
*6A*H.ORTHO I
*4A*IMP
*16A*T.IMPLANTS
*2A*HIMPLANTS
*9A*IMP
*5A*F.IMPLANT
*6A*DIMP
*4A*TISSUE
*5A*KIMP
*7A*IMP
*10A*D.IMP
*3A*W.LSH
*10A*IMP
*16A*IMP
*22A*T.IMPLANTS
在上面的数据集中,我试图提取第二次出现星号之后的所有内容。即D.IMP、IMP、T.IMPLANTS、F.IMPLANT等。
我曾尝试使用SUBSTR,并使用以下命令接近:
SUBSTR(TRIM(FSS.Surgical_Inventory_Code),1,
INDEX(TRIM(FSS.Surgical_Inventory_Code),'*')-1)
但是,这只返回第一个*之后的数据。
我认为解决问题的最佳解决方案是使用REGEX表达式或SUBSTR。teradata中有一个名为REGEXP_SUBSTR的函数。我不太确定如何创建一个REGEX语句来解决我的问题。
发布于 2021-08-03 18:31:32
如果字符串中只有2个星号,可以使用STRTOK:
strtok(<source string>,'*',2)
https://stackoverflow.com/questions/68640802
复制相似问题