首页
学习
活动
专区
圈层
工具
发布
首页标签特征工程

#特征工程

从原始数据转换为特征向量的过程。 特征工程是机器学习中最重要的起始步骤,会直接影响机器学习的效果,并通常需要大量的时间。 典型的特征工程包括数据清理、特征提取、特征选择等过程。

税务周期下的社会工程攻击:基于OPP警示的钓鱼与欺骗机制研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着年度税务申报周期的到来,网络犯罪活动呈现出显著的周期性爆发特征。本文基于安大略省警察局(OPP)发布的最新警示及哈尔顿山地区的具体案例,深入探讨了针对纳税人...

2200

生成式AI驱动的社会工程学攻击演化与多维防御架构研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着大语言模型(LLM)与生成式人工智能技术的普及,网络钓鱼攻击正经历从“劳动密集型”向“智能自动化”的范式转变。近期网络安全数据显示,网络钓鱼已占据邮件威胁总...

5610

基于绩效评估焦虑的社会工程学攻击机制与防御体系研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着企业数字化转型的深入,人力资源管理的电子化流程已成为常态,其中绩效评估作为连接员工利益与组织目标的核心环节,其信息交互频率高、敏感度强。近期网络安全监测数据...

6610

机器学习特征工程:分类变量的数值化处理方法

deephub

编码是机器学习流程里最容易被低估的环节之一,模型没办法直接处理文本形式的分类数据,尺寸(Small/Medium/Large)、颜色(Red/Blue/Gree...

6110

基于行为特征与动态沙箱的AsyncRAT变种检测及防御机制研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着远程办公模式的常态化与企业数字化转型的深入,远程访问木马(Remote Access Trojan, RAT)已成为高级持续性威胁(APT)组织及网络犯罪团...

12210

使用 tsfresh 和 AutoML 进行时间序列特征工程

deephub

时间序列无处不在,心电图上的心跳、股票价格、家庭智能电表读数,甚至句子中词语——这些都是时间序列。它们的特殊之处在于顺序:过去影响未来,相邻的数据点往往高度相关...

13910

特征选择 vs 特征提取的根本差异:安全攻防中的特征工程策略

安全风信子

作者:HOS(安全风信子) 日期:2026-01-09 来源平台:GitHub 摘要: 本文深入剖析特征选择与特征提取的根本差异,揭示它们在安全攻防中的不...

15310

从“特征爆炸”到“精准狙击”:新型特征选择算法如何让反钓鱼系统轻装上阵?

芦笛

中国互联网络信息中心 | 工程师 (已认证)

在每天超过3000亿封电子邮件穿梭于全球网络的今天,钓鱼邮件早已不是“中奖通知”或“尼日利亚王子”的拙劣骗局。它们披着合法外衣,模仿企业IT部门的语气、伪造银行...

8910

派对邀请竟是“数字特洛伊木马”?年末高发的e-vite钓鱼攻击揭示社交工程新变种

芦笛

中国互联网络信息中心 | 工程师 (已认证)

2025年12月中旬,上海某互联网公司产品经理林女士收到一封来自“好友张婷”的邮件,主题是:“你被邀请参加我的30岁生日派对!点击查看详情”。邮件设计简洁,配有...

12810

针对政治机构的鱼叉式钓鱼攻击特征与防御体系构建

芦笛

中国互联网络信息中心 | 工程师 (已认证)

近年来,立法机关及政治人物日益成为高级持续性威胁(APT)和定向网络攻击的重点目标。2025年英国议会成员遭遇的系列鱼叉式钓鱼事件表明,攻击者已具备深度情报收集...

20310

基于节日社会工程的Storm-0900钓鱼攻击机制与防御策略研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

2025年感恩节前夕,微软披露代号为Storm-0900的威胁组织发起了一场以“停车罚单”和“医疗检测结果”为主题的高伪装度钓鱼攻击。该行动利用节假日期间用户心...

15010

构建AI智能体:特征工程行业实践录:金融、电商、医疗的智能化转型

未闻花名

我们已经了解了特征工程的概念和基础应用,今天我们围绕比较广泛的行业示例继续加深理解。

41100

构建AI智能体:特征工程:数据预处理到特征创造的系统性方法

未闻花名

特征工程是数据科学中的关键环节,其核心目标是将原始的、杂乱的数据转化为机器学习模型能够有效理解和利用的格式。这个过程可以类比于将生鲜食材烹饪成美味佳肴的完整流程...

43110

别只会One-Hot了!20种分类编码技巧让你的特征工程更专业

deephub

分类编码是特征工程里最容易被忽视却又最能出效果的环节。scikit-learn自带的编码器只是冰山一角,category_encoders这个库才是真正的百宝箱...

19710

数据湖如何成为AI特征工程与模型训练的基石?腾讯云DLC入选Gartner指南揭示未来趋势

gavin1024

本文深入探讨了数据湖在AI和机器学习场景中支撑特征工程与模型训练的核心价值,重点介绍了腾讯云数据湖计算DLC作为Gartner认可的唯一中国厂商解决方案的技术优...

21810

优雅解读 LightGBM

紫风

LightGBM是一款"轻如鸿毛,快如闪电"的梯度提升框架,专为高效处理大规模数据而生,像一位擅长在数据森林中快速找到最优路径的向导。

18510

【训练医疗领域模型】

贺公子之数据科学与艺术

在医疗领域建立模型时,训练和测试集的准备非常重要。下面是一些步骤和案例分析的示例。

28210

100天跟着CP学PostgreSQL+AI,第11天 : AI 时代的数据库设计:从 ER 图到特征工程思维

用户8465142

作者介绍:崔鹏,计算机学博士,专注 AI 与大数据管理领域研究,拥有十五年数据库、操作系统及存储领域实战经验,兼具 ORACLE OCM、MySQL OCP 等...

27110

大数据集特征工程实践:将54万样本预测误差降低68%的技术路径与代码实现详解

deephub

特征工程作为机器学习流程中的关键环节,在模型训练之前执行,其质量直接影响模型性能。虽然深度学习模型在图像和文本等非结构化数据的特征自动学习方面表现优异,但对于表...

36410
领券