首页
学习
活动
专区
工具
TVP
发布

生信修炼手册

专栏成员
877
文章
1898181
阅读量
184
订阅数
机器学习专题
随着人工智能的火热,机器学习和深度学习技术再一次进入了大众的视野。python的scikit-learn模块专注于机器学习领域,提供了数据集构建,数据预处理,模型算法,效果评估等各个环节的接口,是入门机器学习的最佳模块。
生信修炼手册
2021-07-06
3480
特征选择三板斧
Feature Engineering, 称之为特征工程,属于机器学习中数据预处理阶段的重要内容,细分为以下两大类内容
生信修炼手册
2021-04-29
7940
spectral-cluster聚类算法详解
spectral clustering,称之为谱聚类算法,和近邻传播AP算法一样,也是基于图论的算法,都是将样本点两两相连,构成图这一数据结构,不同的是,谱聚类是通过切图的方式来划分不同的cluster, 其思想是使得子cluster内部边的权重之和尽可能高,而不同子cluster之间边的权重之和尽可能低。
生信修炼手册
2021-04-14
8950
Affinity Propagation聚类算法详解
Affinity Propagation简称AP, 称之为近邻传播算法, 是一种基于图论的聚类算法。将所有样本点看做是一个网络中的节点,图示如下
生信修炼手册
2021-04-14
2.1K0
使用scikit-learn填充缺失值
在真实世界中的数据,难免会有缺失值的情况出现,可能是收集资料时没有收集到对应的信息,也可能是整理的时候误删除导致。对于包含缺失值的数据,有两大类处理思路
生信修炼手册
2021-02-09
2.8K0
线性回归与最小二乘法
x轴表示自变量x的值,y轴表示因变量y的值,图中的蓝色线条就代表它们之间的回归模型,在该模型中,因为只有1个自变量x,所以称之为一元线性回归,公式如下
生信修炼手册
2021-02-09
8670
使用scikit-learn构建数据集
数据是机器学习的必备条件,输入数据的质量高低,是影响机器学习模型效果的决定性因素条件之一。对于机器学习的学习者而言,拥有一个数据集来练手是第一步。在scikit-learn中,提供了多种构建数据的方法
生信修炼手册
2021-01-25
9860
机器学习简介
随着大数据的爆发,以及计算机算力的加强,以机器学习为代表的人工智能领域逐渐火热起来。机器学习有以下几个构成要素
生信修炼手册
2021-01-25
5570
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档