首页
学习
活动
专区
工具
TVP
发布

机器学习原理

专栏作者
119
文章
203936
阅读量
51
订阅数
机器学习可解释性01--shap
本文介绍shap原理,并给出一个简单的示例揭示shap值得计算过程; 然后介绍如何将shap值转化为我们更容易理解的概率。
DC童生
2022-04-02
1.6K0
《A Cancer Survival Prediction Method Based on Graph Convolutional Network》
摘要 背景 现状:多种基因组数据和临床数据尚未综合考虑癌症并预测其生存率 方法 先对各种数据进行融合,然后用GCN来训练 📷 结论 GCN在癌症生存预测方面的有效性和优越性 介绍 异质性疾病癌症具有不同的分子特征、临床行为、形态学表现和对治疗的不同反应 一些传统的机器学习模型用于预测存活 一些机器学习分类方法,如支持向量机(SVM)[16-18],朴素贝叶斯分类器(NB)[19]和随机森林(RF)[20]也可用于预测癌症存活率。例如,Nguyen等人[21]提出了一种基于随机森林
DC童生
2021-12-13
2950
如何理解Inductive Bias
在训练机器学习任务时候,会有一些假设,比如:KNN中假设特征空间中相邻的样本倾向于属于同一类;SVM中假设好的分类器应该最大化类别边界距离;等等。但是真实世界是没有这些假设的。这些假设是归纳出来的,而且和真实世界有一定的偏置,就叫归纳偏置。 在深度学习方面也是一样。以神经网络为例,各式各样的网络结构/组件/机制往往就来源于归纳偏置。在卷积神经网络中,我们假设特征具有局部性(Locality)的特性,即当我们把相邻的一些特征放在一起,会更容易得到“解”;在循环神经网络中,我们假设每一时刻的计算依赖于历史计算结果;还有注意力机制,也是基于从人的直觉、生活经验归纳得到的规则
DC童生
2021-11-29
4480
Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting(论文阅读02)
我们在两个现实世界的大规模数据集上进行了实验:(1)METR-LA此交通数据集包含从洛杉矶县高速公路上的环路检测器收集的交通信息(Jagadish等,2014)。我们选择了207个传感器,并收集了从2012年3月1日到2012年6月30日的4个月的数据进行实验。 (2)PEMS-BA Y该交通数据集由加利福尼亚州运输机构(CalTrans)绩效评估系统(PeMS)收集。我们在湾区选择了325个传感器,并收集了从2017年1月1日到2017年5月31日的6个月数据进行实验
DC童生
2020-12-21
1.4K0
tensorflow2.3实战循环神经网络
一:理论部分 embedding和变长输入处理 序列式问题 循环神经网络 LSTM模型原理 二:实战 keras实现embedding keras搭建循环神经网络 文本生成 文本分类 1.1embed
DC童生
2020-11-24
4340
知识图谱构建
步骤如下: 1 实体识别NER(对专业实体进行分类标记,训练数据,从文中中实现自动抽取专业实体):https://www.jianshu.com/p/68b999d9e552 关键技术:
DC童生
2018-08-27
7.3K1
爬虫篇(3)——招聘网站招聘信息的爬取流程
目的:爬取智联招聘上全国的所有职位信息 职位信息包括:职位名称、福利、待遇、薪水、工作地点、工作经验、学历要求等 流程 包括分析页面和编写代码两部分 分析页面 1.主页面由职业分类组成,找
DC童生
2018-04-28
1.3K0
我的机器学习线性代数篇观点向量矩阵行列式矩阵的初等变换向量组线性方程组特征值和特征向量几个特殊矩阵QR 分解(正交三角分解)奇异值分解向量的导数
前言: 线代知识点多,有点抽象,写的时候尽量把这些知识点串起来,如果不行,那就两串。其包含的几大对象为:向量,行列式,矩阵,方程组。 观点 核心问题是求多元方程组的解,核心知识:内积、秩、矩阵求逆,应用:求解线性回归、最小二乘法用QR分解,奇异值分解SVD,主成分分析(PCA)运用可对角化矩阵 向量 基础 向量:是指具有n个互相独立的性质(维度)的对象的表示,向量常 使用字母+箭头的形式进行表示,也可以使用几何坐标来表示向量。 单位向量:向量的模、模为一的向量为单位向量 内积又叫数量积
DC童生
2018-04-27
1.7K0
机器学习(18)——神经网络算法思想:从线性思想到最基础神经网络神经网络算法
前言: 关于“神经网络”这个词想必对人工智能感兴趣额的早已经熟得不能再熟悉了,在机器学习和认知科学领域,人工神经网络(artificial neural network,缩写ANN),简称神经网络(neural network,缩写NN)或类神经网络,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统
DC童生
2018-04-27
1.7K0
机器学习篇(2)——最小二乘法概念最小二乘法
前言:主要介绍了从最小二乘法到 概念 顾名思义,线性模型就是可以用线性组合进行预测的函数,如图: image.png 公式如下: image.png image.png 误差
DC童生
2018-04-27
1.9K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档