首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何使用子字符串匹配或正则表达式将字符串类型Target变量编码为数字类型

如何使用子字符串匹配或正则表达式将字符串类型Target变量编码为数字类型
EN

Stack Overflow用户
提问于 2019-11-04 15:52:59
回答 1查看 84关注 0票数 0

我使用CTU-13数据集,包括13种检测僵尸网络的场景.在这里,目标变量标签是一个字符串类型变量。标签编码对这个变量,简单地创建大约52-60个独特的数值,数字不同的情况下。但我观察到,如果可以使用子字符串匹配或正则表达式进行标签编码,那么我们可以简单地对3个数字进行编码。然后问题将是三级分类(三级)问题。然后绘制ROC,auc评分就足够简单了。

例如,可以对3种不同的情况进行映射,如“%背景%:0,%normal%:1,%僵尸网络%:2”。那么,如果像这样的字符串实例为-背景udp流,然后将其标记为0,例如到-normal tcp流将其标记为1等等。它们的标准或自定义的编码方式是否像上面那样?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-11-07 06:02:32

最后,我简单地使用以下代码解决了这个问题。首先,采用字符串包含方法提取三个子串。然后简单地对数据进行编码,得到与预期值类似的值。

代码语言:javascript
运行
复制
cat_data.loc[cat_data.Label.str.contains('Normal')] = 'Normal'
cat_data.loc[cat_data.Label.str.contains('Background')] = 'Background'
cat_data.loc[cat_data.Label.str.contains('Botnet')] = 'Botnet' 
target = le.fit_transform(cat_data.Label)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58696867

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档