首页
学习
活动
专区
工具
TVP
发布

机器学习原理

专栏作者
119
文章
203801
阅读量
51
订阅数
机器学习可解释性01--shap
本文介绍shap原理,并给出一个简单的示例揭示shap值得计算过程; 然后介绍如何将shap值转化为我们更容易理解的概率。
DC童生
2022-04-02
1.6K0
《A Cancer Survival Prediction Method Based on Graph Convolutional Network》
摘要 背景 现状:多种基因组数据和临床数据尚未综合考虑癌症并预测其生存率 方法 先对各种数据进行融合,然后用GCN来训练 📷 结论 GCN在癌症生存预测方面的有效性和优越性 介绍 异质性疾病癌症具有不同的分子特征、临床行为、形态学表现和对治疗的不同反应 一些传统的机器学习模型用于预测存活 一些机器学习分类方法,如支持向量机(SVM)[16-18],朴素贝叶斯分类器(NB)[19]和随机森林(RF)[20]也可用于预测癌症存活率。例如,Nguyen等人[21]提出了一种基于随机森林
DC童生
2021-12-13
2950
如何理解Inductive Bias
在训练机器学习任务时候,会有一些假设,比如:KNN中假设特征空间中相邻的样本倾向于属于同一类;SVM中假设好的分类器应该最大化类别边界距离;等等。但是真实世界是没有这些假设的。这些假设是归纳出来的,而且和真实世界有一定的偏置,就叫归纳偏置。 在深度学习方面也是一样。以神经网络为例,各式各样的网络结构/组件/机制往往就来源于归纳偏置。在卷积神经网络中,我们假设特征具有局部性(Locality)的特性,即当我们把相邻的一些特征放在一起,会更容易得到“解”;在循环神经网络中,我们假设每一时刻的计算依赖于历史计算结果;还有注意力机制,也是基于从人的直觉、生活经验归纳得到的规则
DC童生
2021-11-29
4480
Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting(论文阅读02)
我们在两个现实世界的大规模数据集上进行了实验:(1)METR-LA此交通数据集包含从洛杉矶县高速公路上的环路检测器收集的交通信息(Jagadish等,2014)。我们选择了207个传感器,并收集了从2012年3月1日到2012年6月30日的4个月的数据进行实验。 (2)PEMS-BA Y该交通数据集由加利福尼亚州运输机构(CalTrans)绩效评估系统(PeMS)收集。我们在湾区选择了325个传感器,并收集了从2017年1月1日到2017年5月31日的6个月数据进行实验
DC童生
2020-12-21
1.4K0
tensorflow2.3实战循环神经网络
一:理论部分 embedding和变长输入处理 序列式问题 循环神经网络 LSTM模型原理 二:实战 keras实现embedding keras搭建循环神经网络 文本生成 文本分类 1.1embed
DC童生
2020-11-24
4340
知识图谱和可解释性深度学习的发展深度学习问题知识图谱为可解释提供依据利用知识图谱对可解释性应用知识图谱在可解释性上的困难
深度学习的发展 这些年深度学习突飞猛进,各种深度学习模型层出不穷,各种网络结构纷纷登场。 可实际上它发展的本质是由大数据喂出来的,使得机器在图像、语音识别等感知能力方面甚至超越人类。 在深度学习的推动下,自然语言处理方面也取得了显著进展。 深度学习问题 深度学习的一个广为诟病的问题是其不透明性,不可解释性。深度学习模型是一种端到端的学习,接受大样本作为训练输入,所习得的模型本质上是神经网络结构的参数。 其预测过程,是相应参数下的计算过程。 深度学习的学习和预测过程是不透明的,模型究竟学到了什么有效特征,使得
DC童生
2018-10-10
2.1K0
关于知识图谱的几个问题
1.为什么知识图谱对于机器实现人工智能如此重要呢? 知识图谱实现机器认知智能的两个核心能力:“理解”和“解释”。 机器理解数据的本质是建立起从数据到知识库中的知识要素(包括实体、概念和关系)映射的一个
DC童生
2018-10-10
9900
知识图谱构建
步骤如下: 1 实体识别NER(对专业实体进行分类标记,训练数据,从文中中实现自动抽取专业实体):https://www.jianshu.com/p/68b999d9e552 关键技术:
DC童生
2018-08-27
7.3K1
深度学习——目标检测(2)Fast-RCNNFASTER RCNNRCNN网络的演进
前言:RCNN虽然能进行目标检测,但检测的精确度,尤其是速度方面太慢了,没秒才0.03帧。在RCNN基础上做了改进就有了FAST RCNN和FASTER RCNN
DC童生
2018-07-24
3870
深度学习——目标检测(1)什么是目标检测?RCNNRCNN的检测流程:Bounding-box回归
前言:深度学习在图像的应用中目标检测是最基本也是最常用的,下面介绍几种常见的目标检测算法或者模型
DC童生
2018-07-24
6010
深度学习——目标检测(3)YOLO1SSD
前言:RCNN系列一般都是分为两个步骤,下面介绍one-stage方法,SSD和yolo算法 目标检测近年来已经取得了很重要的进展,主流的算法主要分为两个类型: (1)two-stage方法,如R-CNN系算法,其主要思路是先通过启发式方法(selective search)或者CNN网络(RPN)产生一系列稀疏的候选框,然后对这些候选框进行分类与回归,two-stage方法的优势是准确度高; (2)one-stage方法,如Yolo和SSD,其主要思路是均匀地在图片的不同位置进行密集抽样,抽样时可以采用不同尺度和长宽比,然后利用CNN提取特征后直接进行分类与回归,整个过程只需要一步,所以其优势是速度快,但是均匀的密集采样的一个重要缺点是训练比较困难,这主要是因为正样本与负样本(背景)极其不均衡(参见Focal Loss),导致模型准确度稍低。 各种方法速度如下:
DC童生
2018-07-24
6340
深度学习(6)——卷积神经网络cnn层级结构CNN特点卷积神经网络-参数初始化卷积神经网络过拟合解决办法
前言:前面提到的神经元之间的连接都是全连接,当输入超多的时候全连接参数给定也会超多,计算太复杂,这样利用人观察事物的原理,既先抓住事物的主要特征(局部观看),而产生的cnn,不同和重点是加了卷积层(局部感知)和池化层(特征简化)。CNN的应用主要是在图像分类和物品识别等应用场景应用比较多 层级结构 数据输入层:Input Layer 和机器学习一样,需要对输入的数据需要进行预处理操作 常见3种数据预处理方式 1 去均值 将输入数据的各个维度中心化到0 2 归一化 将输入数据的各个维度的幅度归一
DC童生
2018-07-06
1.6K0
深度学习(5)——RBF算法简介
前言:rbf算法用的不多,但他的思想引用到局部逼近,能够更快求解参数,在未来的发展应该不错 简介 RBF网络能够逼近任意非线性的函数。 可以处理系统内难以解析的规律性,具有很好的泛化能力,并且具有较快的学习速度。 有很快的学习收敛速度,已成功应用于非线性函数逼近、时间序列分析、数据分类、 模式识别、信息处理、图像处理、系统建模、控制和故障诊断等。 当网络的一个或多个可调参数(权值或阈值)对任何一个输出都有影响时,这样的网 络称为全局逼近网络。由于对于每次输入,网络上的每一个权值都要调整,从而导致 全局
DC童生
2018-07-06
1.8K0
深度学习(3)——用tensorflow实现机器学习算法1实现线性回归实现逻辑回归
前言:主要用TensorFlow实现线性回归和逻辑回归这两个机器学习算法,就当对TensorFlow的一个应用了吧 1实现线性回归 直接上代码吧,注释和步骤直接在代码里面了 # 1. 构造一个数据 np.random.seed(28) N = 100 x = np.linspace(0, 6, N) + np.random.normal(loc=0.0, scale=2, size=N) y = 14 * x - 7 + np.random.normal(loc=0.0, scale=5.0, size=N
DC童生
2018-07-04
5600
深度学习(1)——tensorflow简介什么是TensorFlow?什么是数据流图?安装基本概念示例变量的更新操作
前言:主要介绍TensorFlow的基础知识,深度学习的基本知识将在后面进行一一介绍 什么是TensorFlow? 可以拿python最经典的计算包numpy来进行比较,和numpy类似,用于数据计算,常用于开发深度学习框架。为了更好理解它,从以下几个方面介绍: 1.TensorFlow是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。 2.从命名来理解:Tensor(张量)意味着N维数组,Flow(流)意味 着基于数据流图的计算。Tensorflow运行过程就是张量从图
DC童生
2018-06-20
3.6K0
深度学习(2)——tensorflow可视化TensorFlow变量作用域TensorFlow可视化示例
前言:主要介绍一下,TensorFlow变量作用域和可视化,变量作用域能更好底可视化展示数据流图 TensorFlow变量作用域 通过tf.Variable我们可以创建变量,但是当模型复杂的时候,需要构建大量的变 量集,这样会导致我们对于变量管理的复杂性,而且没法共享变量(存在多个相 似的变量)。针对这个问题,可以通过TensorFlow提供的变量作用域机制来解决, 在构建一个图的时候,就可以非常容易的使用共享命名过的变量。 变量作用域机制在TensorFlow中主要通过两部分组成: tf.get_va
DC童生
2018-06-20
4010
NLP(1)——词向量one hot编码词向量编码思想Word2VecEmbeddingSkip-gram的原理负采样
前言:深度学习网络rnn能解决有序的问题,我们就生活在这样一个有序的世界。比如时间,音乐,说话的句子,甚至一场比赛,比如最近正在举办的俄罗斯世界杯。 one hot编码 我们在做分类任务的时候经常用到
DC童生
2018-06-19
4.1K0
深度学习——LeNetLeNet解析
前言::LeNet是最早用于数字识别的CNN网络,本文就以数字识别为例,分析下这个最基本的CNN网络。 LeNet解析 网络结构如下图所示: C1层是一个卷积层 6个特征图,每个特征图中的每个神经元与
DC童生
2018-06-12
3960
深度学习——CNN(2)池化层怎么反向传播?为什么采用小批量梯度下降?学习率设置
前言:CNN的优化方法依旧可以是梯度下降的方法,类似于BP算法中的反向传播,一般采用小批量梯度下降的方法,来更新参数,同时回答CNN遗留下来几个问题 池化层怎么反向传播? Maxpool 池化层反向传
DC童生
2018-06-08
4.2K0
深度学习——RNN(3)
前言:在语言结构中,由于词语之间是存在时序关系的,所以RNN在语言处理方面发挥着很大的优势,下面构建一个最简单的RNN结构来实现一个给定几个单词预测下一个单词是什么。实现的关键是对单词和数字之间的相互转换。 详细代码可见:https://github.com/dctongsheng/vocab_predict_rnn 读取数据: def read_data(filename): with open(filename) as f: content = f.readlines()
DC童生
2018-06-06
5150
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档