首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

ML_Basic-特征预处理操作指南

Index 数据清洗 缺失值处理 异常值处理 数据集成 实体识别 冗余属性识别 数据变换 简单函数变换 规范化 变量分箱 变量开发 独热编码 数据规约 特征规约 数值规约 数据清洗 主要是删除原始数据集中无关的数据...、重复的数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理异常值缺失值等操作 ?...缺失值处理 这里需要区分缺失值和空值的区别: 缺失值:缺失值指的是的数据原本是必须存在的,但实际上没有数据。...异常值处理 常用的处理办法包括: 1)删除含有异常值的记录 2)视为缺失值 3)平均值修正 4)不处理 数据集成 数据挖掘的数据来自不同的数据源,数据集成就是将多个数据源合并在一个一致的数据存储中的过程...优点:能够处理非数值属性;在一定程度上扩充了特征;编码后的属性是稀疏的,存在大量的零元分量。

48620

微软开源早期编程语言 GW-BASIC,网友评论这门老语言太难懂了

近日微软通过一篇博客文章宣布开放 GW-BASIC 的源代码。 微软官方人员表示,自从 MS-DOS 1.25 和 2.0 开源后,社区中要求同样开源 BASIC 语言的呼声颇高。...在 70 年代末至 80 年代,微软的 BASIC 被移植到许多 OEM 的特定平台和硬件的需求,并为流行的几个处理器在那个时候,包括 8088,6502,6809,Z80,和其他人。...就像那个年代的所有其他软件(例如 MS-DOS)一样,GW-BASIC 的源代码 100% 由汇编语言编写而成 。...微软解释,当时也可以选择 FORTRAN、LISP、COBOL、RPG、CPL/BCPL 和 C 等高级语言,然而这类语言的编译器比较昂贵,代码生成效率也不高,还受空间和性能限制,不适合家用或个人计算机...不少人希望 808x 以外的处理器的实现也能够开源,不过微软表示,目前无法提供这些资源。

1.1K10
领券